【C0039】TF-IDF文本向量化

新闻传播

自然语言处理

Python

2026-03-09

中级

TF-IDF 文本向量化简介

TF-IDF（Term Frequency-Inverse Document Frequency）是一种用于信息检索和文本挖掘的常用加权技术。它用于评估一个词对于一个文件集或一个语料库中的其中一份文件的重要程度。

公式：

本脚本使用 Python 的 scikit-learn 库，对预设的中文文档列表进行 TF-IDF 向量化处理，并将结果以 JSON 格式打印输出，展示每个文档中关键词及其对应的权重分数。

下载代码

兑换码获取

文件名称： C0039.zip

文件大小： 0MB

更新时间： 2026-03-09