java盘古分词_.NET使用Lucene.Net和盘古分词类库实现中文分词
.NET中文分词实现http://http://使用Lucene.Net.dllhttp://www.apache.org/dist/incubator/lucene.net/binaries/2.9.4g-incubating/PanGu.dllhttp://pangusegment.codeplex.com/releases/view/50811PanGu.Lucene.Analyzer...
.NET中文分词实现http://http://
使用
Lucene.Net.dll http://www.apache.org/dist/incubator/lucene.net/binaries/2.9.4g-incubating/
PanGu.dll http://pangusegment.codeplex.com/releases/view/50811
PanGu.Lucene.Analyzer.dll
和字典文件 http://pangusegment.codeplex.com/releases/view/31531
示例代码:
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using Lucene.Net.Analysis;
using Lucene.Net.Analysis.PanGu;
using System.IO;
using System.Collections;
namespace FcCApp {
class Program {
static void Main(string[] args){
String text = "基于java语言开发的轻量级的中文分词工具包";
Analyzer anal = new PanGuAnalyzer();//使用盘古分词
StringReader sb = new StringReader(text);
TokenStream ts= anal.ReusableTokenStream("", sb);
Token t = null;
while ((t=ts.Next())!=null){
Console.Write(t.TermText()+"|");
}
}
}
}
结果:
基于|java|语言|开发|的|轻量级|的|中文|分词|工具包|
示例下载地址:
http://download.csdn.net/detail/lijun7788/4412762
昇腾计算产业是基于昇腾系列(HUAWEI Ascend)处理器和基础软件构建的全栈 AI计算基础设施、行业应用及服务,https://devpress.csdn.net/organization/setting/general/146749包括昇腾系列处理器、系列硬件、CANN、AI计算框架、应用使能、开发工具链、管理运维工具、行业应用及服务等全产业链
更多推荐

所有评论(0)