这篇教程自然语言处理界的刘焕勇老师的知识分享写得很实用,希望能帮到您。
刘焕勇 liuhuanyong,语言学硕士,目前就职于中国科学院软件研究所,主要从事信息抽取,知识图谱,情感分析, 社会计算等自然语言处理研发工作,兴趣包括:
- 语言资源构建
- 信息抽取与知识图谱
- 舆情监测与社会计算
落地案例
项目名称 |
中文名称 |
项目技术点 |
数地工场 |
自然语言处理语义平台 |
信息抽取、舆情分析、语义计算、信息采集类、问句解析类api |
学迹 |
7*24小时实时事理学习、搜索与关联推理系统 |
实证学习,信息检索、问答搜索,知识推理 |
技术落地与探索博客 |
周更系列的产品与应用落地实践心得分享 |
技术博客、技术探索与应用实践 |
OpenKG开放知识图谱 |
在工业落地过程中与业界共享的图谱数据 |
知识库数据,知识图谱,开放共享 |
学习心得
语言资源构建
自然语言处理基本组件
信息抽取
知识图谱与事理图谱
项目名称 |
中文名称 |
项目技术点 |
EventKGNELL |
学迹事理实时知识库终身学习 |
事件知识库,实时学习,事件概念,事理逻辑,语言资源 |
AbstractKnowledgeGrap |
抽象知识图谱 |
抽象知识图谱,抽象实体,抽象状态,抽象动作 |
GoodsKG |
电商商品概念与销售知识图谱 |
商品概念,商品类知识 |
ZhidaoChatbot |
基于问答社区的逻辑知识问答 |
问答社区,逻辑问答 |
EventPredictBasedOnEG |
基于事理图谱的未来事件预测 |
事理图谱,事件预测 |
QAonMilitaryKG |
军事知识图谱与问答项目 |
知识图谱,军事,基于模板问答方式 |
TravelKnowledgeGraph |
出行知识图谱 |
路径规划,推荐,知识模型 |
PersonRelationKnowledgeGraph |
中文人物关系图谱 |
bootstrapping, 远程监督, 训练数据回标, 关系抽取 |
CrimeKgAssitant |
法律罪行智能助手 |
知识图谱, 智能预判, 自动问答 |
QASystemOnKG |
医疗知识图谱与自动问答 |
知识图谱构建及自动问答 |
ComplexEventExtraction |
复合事件图谱 |
复合事件,条件事件、反转事件抽取 |
CausalityEventExtraction |
因果事件图谱 |
因果图谱,因果事件抽取 |
SequentialEventExtration |
顺承事件图谱 |
动宾短语提取,事件图谱 |
LanguageKnowledgeGraph |
语言政策知识图谱 |
Neo4j,Echarts,D3js |
HyponymyExtraction |
上下位关系图谱 |
模式匹配,上下位概念表示 |
MusicLyricChatbot |
歌词对对碰 |
es搜索,歌词知识库 |
文本挖掘与社会计算
项目名称 |
中文名称 |
项目技术点 |
IdealWordCloudKit |
自定义形状词云项目 |
wordcloud, tfidf, 可视化 |
WeiboIndexSpyder |
微博指数采集 |
selenium,xpath |
BaiduIndexSpyder |
百度指数采集 |
xpath,selenium |
AliIndexSpyder |
阿里指数采集 |
selenium,xpath |
DocSentimentAnalysis |
基于句法依存的情感分析 |
Template, Dependencyparser |
LearningBasedSentiment |
基于深度学习的情感分析 |
CNN,RNN,ML |
TextGrapher |
文本结构化图谱表示 |
EventExtraction,知识表示 |
ImportantEventExtractor |
文本重要性计算 |
textrank |
ZhuguanDetection |
文本主观性计算 |
subjective knowledge base |
SentenceSimilarity |
句子相似度计算 |
distance, hash, haiming ,eidtdistance |
TopicCluster |
文本话题聚类 |
LDA,Kmeans |
EventMonitor |
特定事件追踪 |
新闻采集,事件监测架构,scrapy |
PoemMining |
中国古代诗词挖掘 |
语料库构建,文本挖掘 |
LawCrimeMining |
司法文本挖掘 |
语料库构建,文本挖掘 |
ChineseHumorSentiment |
中文幽默情绪计算 |
语料库构建,幽默分类与情绪计算 |
LanguagePlatform |
集成自然语言处理技术的语言平台 |
Neo4j,Echarts,Django |
深度学习与语义表示
基于Keras的LSTM多变量时间序列预测 返回列表 |