Importación de archivos XML — 5:29 min
5:29 min | Última modificación: Octubre 13, 2021 | YouTube
[1]:
%%writefile /tmp/core-site.xml
<?xml version="1.0" encoding="UTF-8"?>
<?xml-stylesheet type="text/xsl" href="configuration.xsl"?>
<configuration>
<property>
<name>fs.defaultFS</name>
<value>hdfs://0.0.0.0:9000</value>
</property>
</configuration>
Overwriting /tmp/core-site.xml
Interpretación
{
"root": {
"tag": "configuration",
"children": [
{
"tag": "property",
"children": [
{
"tag": "name",
"text": "fs.defaultFS",
},
{
"tag": "vaalue",
"text": "hdfs://0.0.0.0:9000",
}
]
}
]
}
}
[2]:
#
# Ingestión del archivo
# ===============================================
#
import xml.etree.ElementTree as ET
tree = ET.parse("/tmp/core-site.xml")
root = tree.getroot()
root.tag
[2]:
'configuration'
[3]:
#
# Lista de hijos del nodo raiz
#
root.getchildren()
[3]:
[<Element 'property' at 0x7fd56c0fe3b8>]
[4]:
#
# Cantidad de hijos del nodo raiz
#
len(root.getchildren())
[4]:
1
[5]:
#
# tag del primer nodo hijo
#
root[0].tag
[5]:
'property'
[6]:
#
# Primer tag del primer hijo
#
root[0][0].tag
[6]:
'name'
[7]:
#
# Contenido de la propiedad text
# del primer hijo
#
root[0][0].text
[7]:
'fs.defaultFS'
[8]:
#
# Contenido de la propiedad text
# del segundo hijo
#
root[0][1].text
[8]:
'hdfs://0.0.0.0:9000'