如何在VBScript中查找HTML标记的文本

由G.S。杰克逊
但是当他们到达那里时会看到什么??

但是当他们到达那里时会看到什么??

Star从Fotolia.com提供的互联网超链接图片

HTML文本被“标签“它表示用户的Web浏览器将如何格式化该文本。如果您的业务涉及开发处理HTML的特定软件,了解如何获取文本并从元数据中分离内容很有帮助。使用VBScript,可以将HTML数据作为字符串读取,然后根据您要查找的标签将它们分开。这种方式,您可以遵循打开和关闭标记的模式来存储内部文本和分离特定的元数据。

1。

创建文件对象并打开HTML文件:

设置open_file=CreateObject("Scripting.FileSystemObject”设置html_file=open_file.GetFile("C:索引)

2。

逐行读取文件:

微弱电流_线

直到html_file.AtEndOfStream._line=._line&html_file.Readline

回路

三。

沿着所选标记分割HTML文档——在本例中,“““标签。“strip._body_text”变量包含““HTML标签:

Dim body_text(20)body_text=.(._line,“““)

昏暗的._text=.(body_text(1),“““)

strip._body_text=._text(0)

关于作者

G.S.杰克逊专攻与文学有关的话题,计算机和技术。他拥有南伊利诺伊大学爱德华兹维尔分校的英语和计算机科学学士学位。

摄影学分

书目图标 注释工具图标 引用这篇文章