ansj 介绍 作者:马育民 • 2024-03-02 23:09 • 阅读:10026 # 介绍 这是一个基于 `n-Gram+CRF+HMM` 的中文分词的java实现。 分词速度达到每秒钟大约200万字左右(mac air下测试),准确率能达到96%以上。 目前实现了中文分词、中文姓名识别、用户自定义词典、关键字提取、自动摘要、关键字标记等功能。 可以应用到自然语言处理等方面,适用于对分词效果要求高的各种项目。 官网: https://github.com/NLPchina/ansj_seg?tab=readme-ov-file ### maven ``` org.ansj ansj_seg 5.1.1 ``` 原文出处:http://malaoshi.top/show_1IX7Fl6WTyc7.html