NLP与KNN(邻近算法)自然语言处理

论坛 期权论坛 脚本     
匿名网站用户   2020-12-19 12:59   688   0
import jieba
str='我要今天天气'
res=''.join(jieba.cut(str))
print(res)

一、首先导入Jieba中文分词
在这里插入图片描述二、演示
在这里插入图片描述

什么是自然语言处理

自然语言

我们要对自然语言进行理解,其实就是我们日常使用的语言(书面文字和语音视频等)。简言之,汉语、日语、韩语、英语、法语等语言都属于此范畴。而自然语言处理是对自然语言处理的一种技术,就是通过我们的语音文字与计算机进行通信,我们称之为“人机交互”。

自然语言处理

自然语言处理(英语:Natural Language Processing,简称NLP)是人工智能和语言学领域的分支学科。此领域探讨如何处理及运用自然语言;自然语言认知则是指让电脑“懂”人类的语言。自然语言生成系统把计算机数据转化为自然语言。自然语言理解系统把自然语言转化为计算机程序更易于处理的形式。

KNN的案例


# coding=utf-8

import numpy as np
from numpy import *

#创建数据源 返回数据集和类标签
def creat_dataset():
    datasets= array([[8,4,2],[7,1,1],[1,4,4],[3,0,5]])#数据集
    labels=['非常热','很热','一般热','热'] #类标签
    return datasets,labels

if __name__ == "__main__":
     datasets,labels=creat_dataset()
     print("数据集:\n",datasets,'\n 类标签\n',labels)
数据集:
 [[8 4 2]
 [7 1 1]
 [1 4 4]
 [3 0 5]] 
 类标签
 ['非常热', '很热', '一般热', '热']

《参考:https://github.com/bainingchao/NLP-ML/blob/master/探讨自然语言处理技术学习与思考.md》

分享到 :
0 人收藏
您需要登录后才可以回帖 登录 | 立即注册

本版积分规则

积分:1136255
帖子:227251
精华:0
期权论坛 期权论坛
发布
内容

下载期权论坛手机APP