在Python中,可以使用pandas库中的read_html()方法来读取HTML表格。该方法可以自动识别HTML中的表格,并将其转换为pandas的DataFrame对象。下面是一个简单的示例代码,演示了如何使用read_html()方法读取HTML表格:
import pandas as pd
tables = pd.read_html('example.html')
print(len(tables))
print(tables[0])
在上述代码中,首先使用pandas库中的read_html()方法读取HTML文件中的所有表格,并将其存储在一个列表中。然后使用len()函数打印表格数量,使用表格列表的索引访问第一个表格,并使用print()函数打印该表格。如果HTML文件中包含多个表格,可以通过更改索引来访问其他表格,例如tables[1]访问第二个表格。
如果HTML文件中只包含一个表格,可以直接使用read_html()方法读取该表格,并将其转换为pandas的DataFrame对象,例如:
import pandas as pd
df = pd.read_html('example.html')[0]
print(df)
在上述代码中,首先使用read_html()方法读取HTML文件中的第一个表格,并将其转换为pandas的DataFrame对象。然后使用print()函数打印该表格。