4、體差異如下圖所示:1中文分詞算法之基于詞典的逆向最大匹配算法楊尚川-下面看看正向和逆向的分詞效果,使用如下代碼:publicstaticvoidmain(String[]args){Listsentences=newArrayList<>();2中文分詞算法之基于詞典的逆向最大匹配算法楊尚川sentences.add("楊尚川是APDPlat應用級產(chǎn)品開發(fā)平臺的作者");sentences.add("研究生命的起源");sentences.add("長春市長春節(jié)致辭");sentences.ad
5、d("他從馬上下來");sentences.add("乒乓球拍賣完了");sentences.add("咬死獵人的狗");sentences.add("大學生活象白紙");sentences.add("他有各種才能");sentences.add("有意見分歧");for(Stringsentence:sentences){System.out.println("正向最大匹配:"+seg(sentence));System.out.println("逆向最大匹配:"+segReverse(sentence));
6、}}運行結(jié)果如下:開始初始化詞典完成初始化詞典,詞數(shù)目:427452最大分詞長度:16正向最大匹配:[楊尚川,是,APDPlat,應用,級,產(chǎn)品開發(fā),平臺,的,作者]逆向最大匹配:[楊尚川,是,APDPlat,應用,級,產(chǎn)品開發(fā),平臺,的,作者]正向最大匹配:[研究生,命,的,起源]逆向最大匹配:[研究,生命,的,起源]正向最大匹配:[長春市,長春,節(jié),致辭]逆向最大匹配:[長春,市長,春節(jié),致辭]正向最大匹配:[他,從,馬上,下來]逆向最大匹配:[他,從,馬上,下來]正向最大匹配:[乒乓球拍,賣完,了]逆向最
7、大匹配:[乒乓球拍,賣完,了]正向最大匹配:[咬,死,獵人,的,狗]逆向最大匹配:[咬,死,獵人,的,狗]正向最大匹配:[大學生,活象,白紙]逆向最大匹配:[大學生,活象,白紙]正向最大匹配:[他,有,各種,才能]逆向最大匹配:[他,有,各種,才能]正向最大匹配:[有意,見,分歧]逆向最大匹配:[有,意見分歧]3中文分詞算法之基于詞典的逆向最大匹配算法楊尚川下面看看實際的分詞性能如何,對輸入文件進行分詞,然后將分詞結(jié)果保存到輸出文件,輸入文本文件從這里下載,解壓后大小為69M,詞典文件從這里下載,解壓后大小為4
8、.5M,項目源代碼托管在GITHUB:/***將一個文件分詞后保存到另一個文件*@author楊尚川*/publicclassSegFile{publicstaticvoidmain(String[]args)throwsException{Stringinput="input.txt";Stringoutput="output.txt";if(args.length==2){inpu