每日一条

如果你在很年轻的时候,就遭受到了失败,一定要把它当作老天送你的礼物。如果等到四十岁再失败,你会经受不起的。为什么年纪越大,走路越小心,因为越来越经不起跌倒了。(网友) 阅读全部

很多算法(sklearn中的SVC,lightgbm)里的random_state参数作用

参考:网页链接random_state参数的作用就是设置随机数种子,当两段代码设置同样的随机数种子时,这两段代码产生的随机数是一样的。举例:当我切分训练集和测试集时会使用到random_state参数X_train, X_test, Y_train, Y_test = train_test_split(train_feature, train_label, test_size=0.3,random_state=1234)这表示 阅读全部

每日一条

坚持晚上不把手机带上床,这样第二天的精神和眼睛都比以前好很多。 阅读全部

python统计数组每一行出现次数最多的数字

np.bincount()可以把数组中出现的每个数字,当做index,数字出现的次数当做value来表示。np.argmax()可以返回数组中最大值的indexnp.argmax(np.bincount(line)) 阅读全部

数据结构总结(一)

数组的元素都在一起,链表的元素是分开的,每个元素都存储了下个元素的地址。数组的读取速度很快,链表的插入和删除速度很快。二分查找的数组必须是有序的选择排序就是不断找出最小的数放入新数组,最后新数组就是排序好的结果递归有两个条件:基线条件和递归条件栈有两个操作:压入和弹出函数调用都是入栈,函数返回都是出栈;递归就是不断地入栈然后出栈的过程,递归过程太长的话,栈会很长,这将占用大量内存分而治之(D&C divide and conquer)是一种递归式问题解决方法,快速排序就是利用分而治之的思 阅读全部

每日一条

推荐一个短视频,深圳大学2018届毕业设计短片,做的特别棒。网页链接 阅读全部

pandas的groupby方法

提取特征时,pandas的groupby方法特别有用import pandas as pd import numpy as np df.groupby('user_id')['day'].agg(np.mean)#计算每个id使用天数的均值 阅读全部

每日一条

大学时候夏天有游泳课,每个人发一张卡,考试要求平时有游泳次数,必须去够5,6次才行,考核指标就是打卡,去游一次打一次卡。打卡方式就是拿打孔器打眼,现在有的理发店的会员卡还是这种方式。由于我比较懒,就在淘宝上买了个打孔器,当时好象是打孔器3快钱,邮费7块钱,我觉得买亏了啊(没错我就是这么小气),有个舍友说你可以给别人打卡收钱啊,我一想是个好办法,我就先整了一堆小广告往宿舍的厕所里贴,打卡一张五毛,孔数不限,没想到真有人来!陆陆续续来的人还真不少,最后赚了点小钱买了些吃的给宿舍分了。这件事还影响我们 阅读全部

pandas学习笔记(三)--learn from dataquest.io

1.NaN and None 都叫做 null 值如果我们想找出哪些null值,我们可以使用pd.isnull()方法找出pandas series中的null值并返回True或False值。通过这个方法我们可以选择出不包含null值的行。import pandas as pd age_is_null = pd.isnull(titanic_survival["age"]) good_ages=titanic_surviv 阅读全部

每日一条

调和均值是数值倒数的平均值的倒数。可以用在相同距离但速度不同时,平均速度的计算;如一段路程,前半段时速60公里,后半段时速30公里〔两段距离相等〕,则其平均速度为两者的调和平均数时速40公里。F1值就是精确率和召回率的调和均值。 阅读全部