MLA CH2 kNN code part

作者: Mandy今天也沉迷学习 | 来源:发表于2020-03-08 00:29 被阅读0次

MLA CH2 kNN code part
MLA CH2 kNN theory part
kNN Code
CH2 kNN algorithm
重构与DSL
精益编程：Write Lean Programs
重构与函数
CPPYY include 和 load_libraries及动
C22.1-12 - Canadian electrical c
CH2 Release

Python实例

kNN.py:

from numpy import *
import matplotlib
import matplotlib.pyplot as plt
import operator


def createDataSet():
    group = array([[3, 104], [2, 100], [1, 81], [101, 10], [99, 5], [98, 2]])
    names = ["CaliMan", "HNRD", "BW", "KL", "RS3000", "AII"]
    labels = ['R', 'R', 'R', 'A', 'A', 'A', 'A']
    return group, labels, names


def classify0(inX, dataSet, labels, k):
    dataSetSize = dataSet.shape[0]
    # Euclidian distance calculation
    diffMat = tile(inX, (dataSetSize, 1)) - dataSet
    sqDiffMat = diffMat ** 2
    sqDistances = sqDiffMat.sum(axis=1)
    distances = sqDistances ** 0.5
    sortedDistIndices = distances.argsort()  # 排序后的下标
    # print(sortedDistIndices)
    classCount = {}
    # voting
    for i in range(k):
        voteIlable = labels[sortedDistIndices[i]]
        classCount[voteIlable] = classCount.get(voteIlable, 0) + 1
    # sort the dictionary according to the second line
    sortedClassCount = sorted(classCount.items(), key=operator.itemgetter(1), reverse=True)
    return sortedClassCount[0][0]

def scatter(group, names):
    x=group[:, 0]
    y=group[:, 1]
    plt.scatter(x,y)
    for i in range(len(x)):
        plt.annotate(names[i], xy=(x[i], y[i]), xytext=(x[i]+1, y[i]+1))
    plt.show()

group, labels, names = createDataSet()
KNN = classify0([18, 90], group, labels, 3)
scatter(group, names)
print(KNN)

输出结果

result

得出结果：“？”是Romance Movie

如何测试分类器（classifier）？

不同的算法在不同的数据集上表现不同

将已知数据的答案对分类器进行隐藏，让分类器进行判断

得到分类器的 犯错率(error rate)=犯错的累计次数/总测试数

例子——>约会网站数据

Hellen出去约会的有三种人：她不喜欢的/ 她有一点喜欢的/ 她很喜欢的
周一到周五她愿意见有一点喜欢的人，周末更愿意见很喜欢的人
希望对未来的结果能够更加匹配

准备

数据包括：

1000条数据
每年的飞行长旅里程数
打游戏的时间占比
每周消耗的冰淇凌升数

手头无数据，详情过程请见P24-P

标准化数据至（0，1）

测试

前10%数据可以用来测试，90%用于训练。

例子——>手写识别系统

*binary image

网友评论

本文标题：MLA CH2 kNN code part

本文链接：https://www.haomeiwen.com/subject/qvkldhtx.html

延伸阅读

深度阅读

您也可以注册成为美文阅读网的作者，发表您的原创作品、分享您的心情！

MLA CH2 kNN code part

Python实例

输出结果

如何测试分类器（classifier）？

例子——>约会网站数据

准备

测试

例子——>手写识别系统

相关文章

MLA CH2 kNN code part

MLA CH2 kNN theory part

kNN Code

CH2 kNN algorithm

重构与DSL

精益编程：Write Lean Programs

重构与函数

CPPYY include 和 load_libraries及动

C22.1-12 - Canadian electrical c

CH2 Release

网友评论

延伸阅读

深度阅读

栏目导航

热点阅读