25
2018
05

每日一条

csv文件本质上是以英文逗号分割的txt文件,csv文件不可直接在EXCEL中修改,可用记事本打开修改。
24
2018
05

每日一条

你的时间有限,所以不要浪费时间活在别人的生活里。--史蒂夫.乔布斯
23
2018
05

随机森林衡量变量重要性的陷阱

    随机森林中变量的重要性常见的计算方法有两种,一种是mean decrease impurity,即平均不纯度的减少,现在sklearn中用的就是这种方法;一种是mean decrease accuracy,即平均准确率的减少,常用袋外误差率去衡量。    假设我们有两个变量,分别是A和B,A和B之间有较强的相关性,如果A对模型贡献度较大,由于B很像A,所以B也应该对模型贡献较大,但实际情况并不会这样。
22
2018
05

pandas的DataFrame.to_csv()方法输出的csv文件在excel中显示乱码

当我使用Notepad++打开该文件时,中文显示并没有乱码,查看文件编码格式为utf-8无BOM格式编码,而微软产品能正确识别utf-8带BOM格式,所以使用DataFrame.to_csv()输出文件时,编码格式要设置为utf-8带BOM格式,即encoding='utf_8_sig’zhengchang.to_csv('zh.csv',encoding='utf_8_sig')
22
2018
05

大O表示法

大O表示法指出最糟情况下算法的运行时间。大O表示法能让你通过比较操作数来比较算法运行时间的增速。一些常见的大O运行时间。O(n),O(logn),O(n*logn),O(n2),O(n!),其中n,logn,n*logn,n2,n!都成为操作数。--图片来自《算法图解》Aditya Bhargaca
22
2018
05

每日一条

生而为人,如果只剩下一个公平,那就是人人都会死亡。
21
2018
05

每日一条

“35岁时,你恐怕已经屯了两个下半辈子才能读完的科研论文” via:Chemjobber                                            
20
2018
05

python中将txt文件转换为csv文件

注意编码格式csv和txt都要设置encoding=‘utf-8’import csv # attention! 设置newline,否则会出现两行之间有一行空行 with open('result.csv', 'w',newline = '', encoding = 'utf-8') as csvfile
20
2018
05

python把多个txt文件合成一个

首先创建一个python项目(文件夹),在项目目录下创建一个data文件夹,专门存放所有待合并的txt文件。然后创建一个python文件,输入如下代码 import os filedir = os.getcwd()+'./data' #获取txt文件存放路径 filenames=os.listdir(filedir)    #获取各个txt文件的名字,合并时按照filenames的顺序来。
20
2018
05

每日一条

费曼四大高效原则:不必无所不知不必担心别人的想法少想你要成为谁,多想你要做什么保持幽默,坦诚以待