这两天搜集英文单词做词干化处理,虽说standford-NLP可以处理,但是效率不高,自己动手找单词做映射表,找单词真的痛苦!!!放出以下地址最为保存和分享

github:

https://github.com/dwyl/english-words/blob/master/words.txt 里面有4M的英文单词,数据格式有txt和json

https://github.com/Zhangtd/MorTransformation 里面有18万个英语单词,其中包括不规则名词、动词表

 

Logo

开放原子开发者工作坊旨在鼓励更多人参与开源活动,与志同道合的开发者们相互交流开发经验、分享开发心得、获取前沿技术趋势。工作坊有多种形式的开发者活动,如meetup、训练营等,主打技术交流,干货满满,真诚地邀请各位开发者共同参与!

更多推荐