关键字  
 文件名称: ChineseAnalyzerlucene.net 2.0的中文分词器,采用最大向前匹配算法,附上源代码和lucene.net.dll,希下载  收藏√  我顶↑
  所属分类: MultiLanguage
  开发工具: CSharp
  文件大小: 4062 KB
  上传时间: 2007-10-18
  下载次数: 431
  提 供 者: 杨秀云霁
 详细说明:lucene.net 2.0的中文分词器,采用最大向前匹配算法,附上源代码和lucene.net.dll,希望这方面有兴趣的互相交流一下。
 近期下载过的用户:  yjh [查看上载者杨秀云霁的更多信息]
 输入关键字,在本站48万海量源码库中尽情搜索:  帮助
 [Lucene_Chinese.rar] - Lucene 中文版 可帮助英文不好的搜索引擎爱好者学习lucene
 [jsjchaozuoxitong.rar] - 这是一个完整的计算机操作系统的电子书籍,各章内容讲解精辟,是学习的一手好资料
 [RepeatedForms.rar] - 根据相似度去重,把文本很相似的删除掉,基于VSM的算法的实现。
 
 [source.zip] - ac-bm算法。多模式字符串匹配算法 在.Net平台下使用C#开发
 [汉语分词.rar] - 汉语分词系统,对中文语句进行识别,然后分词,是很好的自然语言理解的例子
 [Luceneinaction.rar] - Lucene in Action 中文版代码下载
 [lunce-IKAnalyzer.rar] - 中文分词工具,利用lucence的接口写的,进行最长匹配,正向和反向匹配后根据词数选择。别人写的,我用了,觉得不错,简单,上手快
 [ICTCLAS(C++).rar] - 中科院分词,可供直接使用,源于中科院中文分词网
 [IKAnalyzer.zip] - IKAnalyzer是中文分词工具,基于Lucene2.0版本API开发,实现了以词典分词为基础的正反向全切分算法,是Lucene Analyzer接口的实现,这个是.Net版本,含有源代码
文件列表(点击判断是否您需要的文件):
  中文分词器
  ..........\lucunesearch
  ..........\............\ChinaneseAnalyer
  ..........\............\................\bin
  ..........\............\................\...\Debug
  ..........\............\................\ChineseAnalyzer.cs
  ..........\............\................\ChineseTokenizer.cs
  ..........\............\................\data
  ..........\............\................\....\sDict.txt
  ..........\............\................\....\sNoise.txt
  ..........\............\................\....\sNoise.txt.bak
  ..........\............\................\Lucene.China.csproj
  ..........\............\................\Lucene.China.sln
  ..........\............\................\Lucene.Fanswo.idc
  ..........\............\................\obj
  ..........\............\................\...\Debug
  ..........\............\................\...\Lucene.China.csproj.FileList.txt
  ..........\............\................\...\Lucene.Fanswo.csproj.FileList.txt
  ..........\............\................\Properties
  ..........\............\................\..........\AssemblyInfo.cs
  ..........\............\................\SegerAdapter.cs
  ..........\............\................\WordTree.cs
  ..........\TestForChinsesAnalyzer
  ..........\......................\TestForChinsesAnalyzer
  ..........\......................\......................\bin
  ..........\......................\......................\...\Debug
  ..........\......................\......................\MainForm.cs
  ..........\......................\......................\MainForm.Designer.cs
  ..........\......................\......................\MainForm.resx
  ..........\......................\......................\obj
  ..........\......................\......................\...\Debug
  ..........\......................\......................\...\TestForChinsesAnalyzer.csproj.FileList.txt
  ..........\......................\......................\Program.cs
  ..........\......................\......................\Properties
  ..........\......................\......................\..........\AssemblyInfo.cs
  ..........\......................\......................\..........\Resources.Designer.cs
  ..........\......................\......................\..........\Resources.resx
  ..........\......................\......................\..........\Settings.Designer.cs
  ..........\......................\......................\..........\Settings.settings
  ..........\......................\......................\TestForChinsesAnalyzer.csproj
  ..........\......................\TestForChinsesAnalyzer.sln