一、hownet wordsimilarity 包怎么在java中用
文件列表(点击判断是否您需要的文件,如果是垃圾请在下面评价投诉):
WordSimilarity
。。。。..\.checkstyle
。。。。..\.classpath
。。。。..\.project
。。。。..\.settings
。。。。..\。。。\org.eclipse.core.resources.prefs
。。。。..\ReadMe.txt
。。。。..\bin
。。。。..\。\edu
。。。。..\。\。\buaa
。。。。..\。\。\。.\edu
。。。。..\。\。\。.\。\wordsimilarity
。。。。..\。\。\。.\。\。。。。..\Primitive.class
。。。。..\。\。\。.\。\。。。。..\PrimitiveTests.class
。。。。..\。\。\。.\。\。。。。..\Word.class
二、如何计算多个文本的相似度java程序,利用向量
String text1 = "我爱学习"; String text2 = "我爱读书"; String text3 = "他是黑客"; TextSimilarity textSimilarity = new CosineTextSimilarity(); double score1pk1 = textSimilarity.similarScore(text1, text1); double score1pk2 = textSimilarity.similarScore(text1, text2); double score1pk3 = textSimilarity.similarScore(text1, text3); double score2pk2 = textSimilarity.similarScore(text2, text2); double score2pk3 = textSimilarity.similarScore(text2, text3); double score3pk3 = textSimilarity.similarScore(text3, text3); System.out.println(text1+" 和 "+text1+" 的相似度分值:"+score1pk1); System.out.println(text1+" 和 "+text2+" 的相似度分值:"+score1pk2); System.out.println(text1+" 和 "+text3+" 的相似度分值:"+score1pk3); System.out.println(text2+" 和 "+text2+" 的相似度分值:"+score2pk2); System.out.println(text2+" 和 "+text3+" 的相似度分值:"+score2pk3); System.out.println(text3+" 和 "+text3+" 的相似度分值:"+score3pk3); 运行结果如下:我爱学习 和 我爱学习 的相似度分值:1.0 我爱学习 和 我爱读书 的相似度分值:0.4 我爱学习 和 他是黑客 的相似度分值:0.0 我爱读书 和 我爱读书 的相似度分值:1.0 我爱读书 和 他是黑客 的相似度分值:0.0 他是黑客 和 他是黑客 的相似度分值:1.0 方式二:简单共有词,通过计算两篇文档有多少个相同的词来评估他们的相似度 实现类:org.apdplat.word.analysis.SimpleTextSimilarity 用法如下:String text1 = "我爱学习"; String text2 = "我爱读书"; String text3 = "他是黑客"; TextSimilarity textSimilarity = new SimpleTextSimilarity(); double score1pk1 = textSimilarity.similarScore(text1, text1); double score1pk2 = textSimilarity.similarScore(text1, text2); double score1pk3 = textSimilarity.similarScore(text1, text3); double score2pk2 = textSimilarity.similarScore(text2, text2); double score2pk3 = textSimilarity.similarScore(text2, text3); double score3pk3 = textSimilarity.similarScore(text3, text3); System.out.println(text1+" 和 "+text1+" 的相似度分值:"+score1pk1); System.out.println(text1+" 和 "+text2+" 的相似度分值:"+score1pk2); System.out.println(text1+" 和 "+text3+" 的相似度分值:"+score1pk3); System.out.println(text2+" 和 "+text2+" 的相似度分值:"+score2pk2); System.out.println(text2+" 和 "+text3+" 的相似度分值:"+score2pk3); System.out.println(text3+" 和 "+text3+" 的相似度分值:"+score3pk3); 运行结果如下:我爱学习 和 我爱学习 的相似度分值:1.0 我爱学习 和 我爱读书 的相似度分值:0.5 我爱学习 和 他是黑客 的相似度分值:0.0 我爱读书 和 我爱读书 的相似度分值:1.0 我爱读书 和 他是黑客 的相似度分值:0.0 他是黑客 和 他是黑客 的相似度分值:1.0。
三、关键词工具哪个好用
较流行的关键词查询工具站: 1. Google Adwords - https://adwords.google.com/select/KeywordToolExternal 这个不用说,相信大家都用过。
2. Keyword Tracker - http://freekeywords.wordtracker.com/ 也是一个老牌站,数据不错,但长尾词流量显示较真是量高。 3. Keyword Discovery - http://www.keyworddiscovery.com/search.html 这是我最常用的一个(除Adwords 外)。
4. Wordze - http://www.wordze.com/ 没太多研究。
. 5. SEO Book Keyword Tool - http://tools.seobook.com/keyword-tools/seobook/ 在点石经常听到,说明很多中国站长都在用它,群众的眼睛是雪亮的,这么多人用,相信不错! 6. SEO Digger - http://seodigger.com/ 主要用它来查排名的。 7. Keyword Spy - http://www.keywordspy.com/ 没有研究,待大家观察、补充。
8. Spyfu - http://www.spyfu.com/ 它能告诉你,你竞争对手的网站,哪个关键词排在搜索引擎的前面。 9. Nichebot - http://www.nichebot.com/ 没用过,有经验的朋友可以分享下使用心得 其他一些主流引擎关键词查询工具: 1. Google Search Suggest - http://www.google.com/webhp?complete=1 2. MSN Adcenter Keyword Tools - http://adlab.msn.com/Keyword-Research.aspx 3. Google Sets - http://labs.google.com/sets 4. Google Related Keywords - http://www.gorank.com/seotools/ontology/index.php 4. Keyword Research tool - http://www.webmaster-toolkit.com/keyword-research-tool.shtml 5. Keyword Data Miner Tool - http://www.seocompany.ca/tool/keyword-find/ 关键词趋势类工具站: 1. eBay Pulse - http://pulse.ebay.com/ 2. Yahoo! Buzz - http://buzz.yahoo.com/overall/ 3. Google Hot Trends - http://www.google.com/trends/hottrends 4. Google Trends - http://www.google.com/trends 5. Google Zeitgeist - http://www.google.com/press/zeitgeist.html 6. AOL Search Hot Searches - http://hot.aol.com/ 7. PPydt Trends - http://www.pp9pp9.cn/ 8. Ask Jeeves Interesting Queries - http://sp.ask.com/docs/about/jeevesiq.html 9. Lycos Hot 50 - http://50.lycos.com/ 其他搜索引擎关键词趋势类工具: 1. Thesaurus.com - http://thesaurus.reference.com/ 2. Dependency-based Word Similarity - http://www.cs.ualberta.ca/~lindek/demos/depsim.htm 3. Hitwise Search Intelligence - http://www.hitwise.com/。
转载请注明出处51数据库 » wordsimilarity使用
亖呉?盀