使用BS4对象抓取网页上的表格
代码 import requests from bs4 import BeautifulSoup import pandas as pd url="https://www.shanghairanking.cn/rankings/bcur/2020" def getsoup(url,sever): try: hd={'U…
英语学习(九)
与“公司高管”有关的词 abound vi (in)富于,大量存在;(with)充满 acceptable a.可接受的,合意的 adhere vi.(to)黏附,胶着;(to)坚持 stick vi.粘贴 ambition n.雄心,野心 fulfill one's ambition 实现抱负 aspiration n.强烈的愿望,志向,抱负 a…
常见类型数据的存储原理
文本存储 文本是数字数据的一个例子,它类似于数据进行位模式的存储。根据位数和应用的不同,产生了不同的编码标准。 常见编码标准有ASCII码和Unicode。 存储音频 音频是模拟数据的一个例子,是一个可无限分割的连续过程,由于存储空间有限,故不可能将其完整存储。 一个有效的办法是对音频进行采样,对样本将模拟信号转化量化(取整)数字信号,进而使用位模…
英语学习(八)
句子: AS boards scrutinize succession plans in response to shareholder pressuer,executives who don't get the nod also may wish to move on. 当董事会认真检查继任计划来回应股东压力时,那些没被选中的高管们可能也想离开。…
第三章 再(又)见-K近邻算法(二)
K近邻算法关键要素 1 距离度量标准 特征空间中,实例位置各维度是由每个维度的特征决定的,因此在特征空间中,实例点之间距离的远近,代表着实例点综合特征的相似程度,因此要用距离对实例点相似程度进行度量。 距离度量的方式有很多,最常用的就是欧氏距离,但是也可以是其他距离,如明可夫斯基距离、兰氏距离等。对于K近邻算法,使用不同的距离作为度量标注,可能会得…
第二章 感知机模型(二)
对感知机模型的再理解 感知机学习算法收敛性证明过程 感知机学习算法的对偶形式 1 参数间的关系(刷新页面可见公式) 1)与简单形式相同,初始w=0,b=0不变 2)对于每个实例x_i,都存在着对应的\alpha_i ,其中\alpha_i=ny_ix_i,n代表实例x_i误判对应的迭代次数。 3)设共有N个实例点,则对应每个实例点均有 \alpha…
关于我
我是一个神秘的人物。
第三章 K近邻算法(一)
第一节 k近邻算法 简介:k近邻算法是一种基本的分类与回归方法。输入为实例的特征向量,输出 为实例的类别,可以取多类。 k近邻算法假设给定一个训练数据集,其中的实例类别已定。分类时,对新的实 例,根据其k个最近邻的训练实例的类别,通过多数表决的方式进行预测。 算法概述: 输入:数据集T 输出:实例x所属的类别y 根据给定的距离度量,在训练集T中找出…
第二章 感知机模型(一)
第一节 感知机模型 简介:感知机是二分类的 线性 分类模型,输入是实例的特征向量,输出实例类别,取+1和-1二值。 感知机在输入空间(特征空间)中通过一个使用一个超平面将实例划分为正负两 类。 故此,问题的关键就在于如何求出该超平面(线性分类器)。 我们可以计算基于错误分类的0-1损失函数,利用提梯度下降法对损失函数进行 极小化,求得感知机模型。 …
第一章 统计学习及监督学习概论(七、八)
第七节生成模型与判别模型 监督学习的任务: 学习模型—〉输入数据—〉输入结果 监督学习方法分为生成方法和判别方法 生成方法由数据学习联合概率分布p(x,y),然后求出条件概率分布p(y|x)作为预 测的模型,即生成模型。 之所以称之为生成方法,是因为模型表示量给定输入x产生y的输出关系。 判别方法直接学习决策函数f(x)或者条件概率分布P(y|x)…