python html转TXT python读取html指定区域文本内容转成txt文件

python html转TXT python读取html指定区域文本内容转成txt文件

技术教程gslnedu2025-06-16 20:44:302A+A-

#科技之巅#python html指定区域文本内容转称txt文本文件

1、首先,通过python,去将读取遍历程序目录文件夹中,【html】文件夹里面的文件、文件

夹以及子目录、子目录里面的 ,获取到该目录下所有的【.html】文件后,返回一个list对象

2、遍历完成后得到一个html文件列表对象,将该列表交给html_to_txt方法,html_to_txt方法

里面循环逐个读取html文件中指定标签中<DIV>标签中<H1>标签中的文字,和中指定标签

<TD>里面<P>标签的文字提取出来

3、读取到的文本内容输出到txt文件中,这里可以加上一个替换replace,把我们不需要的内

容替换之后,这里可以做多次替换,也可以加上换行之类的处理,再进行输出,可根据自己

的需求修改,如果有什么不明之处,可以提问

点击这里复制本文地址 以上内容由朽木教程网整理呈现,请务必在转载分享时注明本文地址!如对内容有疑问,请联系我们,谢谢!
qrcode

朽木教程网 © All Rights Reserved.  蜀ICP备2024111239号-8