SpaCy ，一个强大而易用的python库

自然语言处理（NLP）是人工智能的一个重要分支，它研究如何让计算机理解和处理人类语言。今天，就来介绍一个强大的 NLP 库 —— SpaCy，它可以帮助我们轻松地进行各种 NLP 任务，例如词性标注、命名实体识别、文本分类等等。

SpaCy 是一个 Python 库，它提供了先进的 NLP 工具，包括：

使用 pip 可以轻松安装 SpaCy：

pip install spacy

还需要下载语言模型：

python -m spacy download en_core_web_sm

首先，需要加载语言模型：

import spacy

# 加载语言模型
nlp = spacy.load("en_core_web_sm")

使用 nlp() 方法处理文本：

# 处理文本
text = "Apple is looking at buying U.K. startup for $1 billion"
doc = nlp(text)

使用 token.pos_ 属性获取单词的词性：

# 遍历句子中的单词
for token in doc:
    print(token.text, token.pos_)

使用 token.ent_type_ 属性获取单词的命名实体类型：

# 遍历句子中的命名实体
for ent in doc.ents:
    print(ent.text, ent.label_)

使用 token.dep_ 属性获取单词的依存关系：

# 遍历句子中的单词
for token in doc:
    print(token.text, token.dep_, token.head.text)

使用 token.lemma_ 属性获取单词的词形还原：

# 遍历句子中的单词
for token in doc:
    print(token.text, token.lemma_)

使用 token.vector 属性获取单词的词向量：

# 获取单词 "apple" 的词向量
apple_vector = doc[0].vector

SpaCy 可以用于各种 NLP 任务，例如：

SpaCy 是一个功能强大且易于使用的 NLP 库，它可以帮助我们轻松地进行各种 NLP 任务。

原文始发于微信公众号（程序员六维）：SpaCy ，一个强大而易用的python库

文章由极客之音整理，本文链接：https://www.bmabk.com/index.php/post/283900.html