要创建一个知识图谱,需要两部分信息:一是知识库,它可以是文本语料库、代码库、文章集合等;二是本体,即我们关心的实体类别及其关系类型。

要创建一个知识图谱,需要两部分信息:一是知识库,它可以是文本语料库、代码库、文章集合等;二是本体,即我们关心的实体类别及其关系类型。

例如,对于一般的知识图谱,可能有“实体:人、地点”“关系:人→相关于→人、人→居住在→地点、人→访问→地点”等。但如果知识库是关于处方药及其相互作用的临床研究,可能会使用不同的本体,如化合物、用法、效果、反应等构成本体。

与传统方法相比,这种利用非结构化数据生成知识图谱的方法更易操作且信息更丰富,非常适合 GRAG 等应用。

在使用 LLM 创建知识图谱时,会存在一些挑战,如 LLM 提取的实体类别可能过于多样化,会错误地将抽象概念标记为实体;在不同上下文中可能错误地标记相同实体;其输出本质上不可预测,拆分语料库生成子图时,若丢失一个可能影响整个图谱的连接性等。

总之,创建生成式 AI 知识图谱需要综合考虑知识库和本体的选择,以及应对使用 LLM 过程中出现的各种挑战。https://tuingai.com/

© 版权声明
THE END
喜欢就支持一下吧
点赞0 分享
Mankind is made great or little by its own will.
一个人伟大或渺小,取决于他的意志力
的头像-AI星球圈
评论 抢沙发

请登录后发表评论

    暂无评论内容