【控件】Delphi中HTML文件中的数据提取组件 DIHtmlParser 7.12.0 For10.3

 

DIHtmlParser是用于Delphi程序员从HTML文件提取数据的组件。使用此组件,程序员可以分析HTML,XHTML和XML文档,并从这些文档中提取所需的任何信息。如果您需要在不同的网站之间编写爬虫或数据搜寻器,则使用此组件将为您带来很多帮助,通过使用此产品,您可以更轻松地从其他网站提取所需的数据,实际上,此产品很麻烦。这需要花费很多代码才能完成。该组件是为Delphi语言设计的,可以在各种Delphi编程环境中使用,例如Embarcadero,CodeGear和Borland。

此组件可以提取的一些数据:

  • CData部分中的数据

  • 您可能在文档的不同部分中使用了不同的注释

  • DTD或文档类型定义

  • 所有HTML标签(超过80个不同的标签)

  • 标签之间定义的脚本 SCRIPT>

  • 能够读取位于<STYLE>标记之间的html文档的文本样式

  • 能够阅读不同的文本(段落和…)

  • 阅读不同的标题和元数据

  • 解析XML文档的能力

  • 检测特定标签之间的服务器端ASP代码

  • 识别定义的自定义标签

  • 检测PHP代码之间<?php?>已定义

  • 检测SSI代码

  • 还有...

DIHtmlParser组件的功能和规格:

  • 完全支持Unicode(这意味着完全支持波斯和阿拉伯语数据提取以及其他Unicode语言)

  • 读写70多种不同字符集的数据(与操作系统无关)

  • 借助DIConverters支持150多种不同的字符集

  • 使用TStream,内存缓冲区或字符串

  • 只能处理HTML文档的一部分

  • 通过TDIHtmlParserPlugin接口轻松开发

  • 还有...

下载


Delphi 10.3 Rio的DIHtmlParser 7.12.0



联系电话:
020-00000000
联系电话:
020-00000000
联系电话:
020-12345678