1.集合:
集合的创建:
list_1 = set([1,2,3,4,5])
list_2 = set([2,3,44,7,8])
集合的特性:集合是无序的,集合可以去掉重复的元素
集合的操作:
求交集:print(list_1.intersection(list_2)) #{2,3}print(list_l & list_2) #求交集,{2,3}
求并集:
print(list_1.union(list_2)) #{1,2,3,4,5,7,8,44}print(list_l | list_2) #求并集,{1,2,3,4,5,7,8,44}
求差集:
print(list_1.defference(list_2)) #in list_1 but not in list_2,{1,4,5}print(list_l - list_2) #求差集,in list_1 but not in list_2:{1,4,5}
判断子集:
print(list_1.issubset(list_2)) #list_1是否是list_2的子集,None
判断父集:
print(list_1.issuperset(list_2)) #list_1是否是list_2的父集,None
对称差集:
print(list_l.symmetric_difference(list_2)) #对称差集,并集里面去掉交集,{1,4,5,7,8,44}
print(list_l ^ list_2) #对称差集,并集里面去掉交集
判断交集:
print(lsit_1.isdijoint(list_2)) #Yes
增加:
lsit_3 = set([1,2,3,4])#单个增加:list_3.add(5)#多个增加:list_3.update([6,7,8,9])
删除:
删除:list_3.remove(1)print(list_3.pop()) #随机删除
求集合的长度:
print(len(list_3))2.文件
文件的创建:
f = open("yesterday","w",encoding="utf-8") '''#with语句,为了避免打开文件后忘记关闭,可以通过管理上下文,即:with open("log","r") as f: pass#python2.7之后,with有支持同时对多个文件的上下文进行管理,即:with open("log1") as obj1,open("log2") as obj2: psss'''#开发规范:一行不得超过八十个字符with open("yesterday2","r",encoding="GB18030") as f,\ open("yesterday","r",encoding="GB18030") as f2: for line in f: print(line.strip())
文件的操作:
读:f = open("yesterday","r",encoding="utf-8")#不可写data = f.read()print(data) #输出文件的内容list = f.readlines() '''#将硬盘中的数据全部读入内存中形成一个列表,并且自动添加了换行符. ['我爱北京天安门,\n', '天安门上太阳升\n', '我爱北京天安门\n']'''print(f.readline()) #一行一行地读#循环读:for line in f:print(line)
写:
f = open("yesterday","w",encoding="utf-8")#不可读,每运行一次就会创建一个新的文件覆盖掉原来的文件f.write("sladjla")
追加:
f = open("yesterday","a",encoding="utf-8")#不可读f.write("sldad")
句柄位置操作:
print(f.tell()) #打印句柄位置f.seek(5) #使句柄回到某个位置print(f.encoding) #打印文件的编码print(f.fileno()) #返回文件编号print(f.name) #打印文件名字print(f.isatty()) #判断是否为终端设备 True、Falseprint(f.seekable()) #判断句柄是否可移 True、Falseprint(f.readable()) #判断文件是否可读 True、False
刷新:
f.flush()#刷新,将内存中的内容一次性刷入硬盘中import sys,timefor i in range(50): sys.stdout.write("#") sys.stdout.flush() time.sleep(0.1)
读写、写读、追加的、二进制读写:
f = open("yesterday2","r+",encoding="GB18030")#读写模式,不会清空原文件f = open("yesterday2","w+",encoding="GB18030")#写读模式,会清空原文件f = open("yesterday2","a+",encoding = "GB18030")#追加读f = open("yesterday2","rb或者wb") #二进制文件print(f.readline())print(f.readline())print(f.readline())print(f.tell())f.write("\n------diao------") #只能添加在末尾print(f.readline())#文件操作的二进制读写f = open("yesterday2","rb")print(f.readline())#b'\r\n'f = open("yesterday2","wb")f.write("hello binary".encode())#只能写入二进制格式'''"U"表示在读取时,可以将\r \n \r\n自动转换为\n(与r或r+模式同时使用)> rU> r+U'''
文件修改:
f = open("yesterday","r",encoding="GB18030")f_new = open("yesterday3","w",encoding="GB18030")for line in f:if "poj" in line: line = line.replace("poj","急急急急急急") f_new.write(line)f.close()f_new.close()
3.字符编码与转换:
GBK--decode-->unicode【中间站】--encode-->utf-8 utf-8--decode-->unicode【中间站】--encode-->GBk GBK转换为utf-8流程: 1.首先通过编码【decode】转换为Unicode编码 2.然后通过解码【encode】转换为utf-8编码 utf-8转换为GBK流程: 1.首先通过编码【decode】转换为Unicode编码 2.然后通过解码【encode】转换为utf-8编码 utf-8是Unicode编码的扩展集,故在utf-8程序中,Unicode格式可以直接打印 但是GBK编码不能在Unicode程序中直接打印,即使Unicode兼容GBK编码 在python2中解释器默认是ASCII码 python3中解释器默认是unicode编码 在python3中进行转码、编码会自动转成二进制类型
s = "你好"s_gbk = s.encode("gbk")print(s_gbk)#b'\xc4\xe3\xba\xc3'print(s.encode())#b'\xe4\xbd\xa0\xe5\xa5\xbd'gbk_to_utf8 = s_gbk.decode("gbk").encode("utf-8")print(gbk_to_utf8)#b'\xe4\xbd\xa0\xe5\xa5\xbd's = "你哈"print(s.encode("gbk")) #b'\xc4\xe3\xb9\xfe',因为解释器默认是Unicode编码print(s.encode("utf-8")) #b'\xe4\xbd\xa0\xe5\x93\x88'print(s.encode("utf- 8").decode("utf8").encode("gb2312").decode("gb2312"))#你哈
4.函数与函数式编程:
编程方法:1.面向对象2.面向过程
3.函数式编程
函数定义:
函数式逻辑结构化和过化的一种编程方法
python中函数定义的方法:
def text(x): "The function definition" x += 1 return x''''def:定义函数中的关键字text:函数名():内可定义形参"":文档描述(非必要,但是强烈建议为你的函数添加描述信息)x += 1:泛指代码或程序处理器return:定义返回值''''
使用函数的优点:
1.避免了大量代码的重复使用2.保持一致性:修改函数中的代码,在所有使用函数的地方都会改变
3.可扩展性(一致性)
import time def logger(): time_format = "%Y=%m-%d %X" time_current = time.strftime(time_format) with open("hahaha","a+",encoding="utf-8") as f: f.write("%send action\n"%time_current) def text1(): print("in the tex1") logger() def text2(): print("in the tex2") logger() def text3(): print("in the tex3") logger() text1() text2() text3()
函数和过程:
过程定义:过程就是简单没有返回值的函数
总结:一个函数/过程没有使用return显性的定义返回值时,python解释器会隐式返回None,所以在python中即便是过程也可以算作是函数
#函数: def func1(): "testing1" print("in the func1") return 0 #过程: def func2(): "testing2" print("in the func2") x = func1() print("from func1 return is %s "%x) #from func1 return is 0 y = func2() print("from func2 return is %s"%y) #from func2 return is None #当一个函数/过程没有使用return显性的定义返回值时,python解释器会隐式返回None, #所以在python中即便是过程也可以算作函数
函数返回值:
返回值数=0,返回None
返回值数=1,返回object返回值数>1,返回tupledef text1(): print("in the text1") ''' return 0 #结束函数,并返回一个值 print("text end") #不会执行 ''' def text2(): print("in the text2") return 0 def text3(): print("in the text3") return 1,"hello",["alex","wupeiqi"],{ "name":"alex"} x = text1() y = text2() z = text3() print(type(x),x) #None print(type(y),y) # 0 print(type(z),z) # (1, 'hello', ['alex', 'wupeiqi'], {'name': 'alex'})
函数调用:test()执行,()表示调用test,()可以有参数也可以没有
参数:
1.形参和实参: 形参:形式参数,不是实际存在的,是虚拟变量。在定义函数和函数体的时候使用形参,目的是在函数调用时接受实参(实参个数、类型因该与形参一一对应) 实参:实际参数,调用函数时传给函数的参数,可以是常量、变量、表达式、函数传给形参 区别:形参时虚拟的,不占用内存空间,形参变量只有在被调用时才分配内存单元,实参是一个变量,占用内存空间,数据传送单向,实参传给形参,不能形参传给实参 2.位置参数和关键字参数(标准调用:实参和形参位置一一对应;关键字调用:位置无需固定)
#标准调用,实参与形参一一对应 def test1(x,y): "x、y是位置参数" print("in the test1:") print("x = %s\ny = %s"%(x,y)) test1(2,1) #实参跟形参必须一一对应 #关键字调用,与形参顺序无关 def test2(x,y): print("in the test2:") print("x = %s\ny = %s"%(x,y)) test2(y = 1,x = 2) #test2(x = 2,3) error #test2(3,y = 2) OK #因此关键字参数不能位于位置参数的前面
3.默认参数:特点:调用函数的时候,默认参数非必须传递
def test(x,y=2): print(x) print(y) test(x = 1,y = 3) #OK test(1) #OK #test(y = 3) error #特点:调用函数的时候,默认参数非必须传递
4.参数组
def test(*args): print(args) test(1,2,3,4,5) #(1, 2, 3, 4, 5) test(*[1,2,3,5,5]) #args = tuple([1,2,3,5,5]):(1, 2, 3, 5, 5) def test1(x,*args): print(x) print(args) test1(1,2,3,4,5,6,34,3) #1 #*args是接收N个位置参数,转换成元组的方式 (2, 3, 4, 5, 6, 34, 3) #**kwargs:是就收N个关键字参数,转换成字典的方式;传递字典 def test2(**kwargs): print(kwargs) test2(name = "alex",age = 22,sex = "N") #{'name': 'alex', 'age': 22, 'sex': 'N'} def test3(name,*args,**kwargs): print("the information of %s:"%name) print(kwargs) print("%s like the numbers:%s"%(name,args)) test3("alex",3,7,21,age = 19,sex = "m") #def test4(name,**kwargs,age=18) error,默认参数必须放在参数组的前面 #def test4(name,age=18,**kwargs) OK
注意:1.关键字参数必须位于位置参数的后面 2.默认参数必须放在参数组的前面
前向引用:
函数action体内嵌套某一函数logger,该logger的声明必须早于action函数的调用,否则报错
全局变量与局部变量:
在子程序中定义的变量称为局部变量,在程序一开始定义的变量称为全局变量。 全局变量作用域是整个程序,局部变量作用域是定义该变量的子程序当全局变量与局部变量冲突时: 在定义局部变量的子程序内,局部变量会屏蔽掉全局变量,在其他地方全部变量起作用
school = "Oldboy edu" #全局变量 def change_name(name): "这个函数就是其内部即局部变量的作用域" global school #将school改为全局变量 school = "mage linux" print("school:",school) print("before change:",name) name = "Alex li" print("after change:",name) name = "alex" change_name(name) print(name)#alex print("shcool:",school)#shcool: mage linux #一般来说,我们不应该在函数内部将局部变量改为全局变量 因为这样在无数次调用这个函数后,我们很难知道实在哪儿将变量修改了 故我们不应该使用这种方法: def change_name(): global name name = "alex" change_name() print(name) #附注:列表、字典是可以在函数中修改的
高阶函数:
变量可以指向函数,函数的参数能接收变量,那么一个函数就可以接收另一个函数作为参数,这种函数就叫高阶函数
def abs(x): if x>=0: return x else: return -x def add(a,b,f): return f(a)+f(b) print(add(3,-6,abs)) #9
递归:定义:如果一个函数在内部调用自己本身,这个函数就是递归函数
特性:1.必须有一个明确的结束条件
2.每次进入更深一层循环时,问题规模相比上次递归有所减少
3.递归效率不高,递归层次过多时回导致栈溢出
def cal(n): print(n) if int(n/2)>0: return cal(int(n/2)) print("---->",n)cal(10)