关键字  
 文件名称: HTMLtoTXT将HTML网页格式中的正文提取出来

主要是小说网上下载的打包小说下载  收藏√  我顶↑
  所属分类: MultiLanguage
  开发工具: CSharp
  文件大小: 42 KB
  上传时间: 2008-07-24
  下载次数: 7
  提 供 者: gougou
 详细说明:将HTML网页格式中的正文提取出来 主要是小说网上下载的打包小说
 近期下载过的用户:  颜城 zhou 读宴宾 [查看上载者gougou的更多信息]
 输入关键字,在本站51万海量源码库中尽情搜索:  帮助
 [hexbin.rar] - hex 文件转换.bin 的格式的程序。dos 环境下运行。
 [U_ANSI.rar] - 由汉字查看其Unicode及ansi码的软件
 [HtmlAnylse.rar] - 网页是组成互联网的基本数据单元,是各种面向互联网的应用系统最原始的数据源。网页内部含有大量噪音信息,如何从网页中有效地提取有价值的内容成为影响数据处理效果的关键。 网页正文提取指的是从原始网页中精确地提取出正文文本,比如提取新闻网页中的报道内容。能否高效地提取出网页的正文,是很多互联网应用系统
 
 [mars212dc_Html.rar] - 我自己写的,提取网页中正文的程序,下载后大家自己修改里面的关键词
 [zhaobzl1932yqb.rar] - 防火墙及网络安全国家标准,主要介绍网安行业测试规范!共5部分,此为一部分
 [IR.rar] - 对爬虫爬下来的内容进行正文提取,具有很好的参考价值
文件列表(点击判断是否您需要的文件):
  HTML转TXT
  .........\HTML转TXT
  App.ico
  .........\.........\AssemblyInfo.cs
  .........\.........\bin
  .........\.........\...\Debug
  .........\.........\Form1.cs
  .........\.........\Form1.resx
  .........\.........\HTML转TXT.csproj
  .........\.........\HTML转TXT.csproj.user
  .........\.........\obj
  .........\.........\...\Debug
  .........\HTML转TXT.exe
  .........\HTML转TXT.pdb
  .........\HTML转TXT.sln