当一个文档特别大的时候(比如wikidata等知识库的dump),往往会采用bz2或者gz对其进行压缩,方便下载,同时减少存储空间(bz2压缩率更高一些)。
那么,如何不用解压也能读取原来的文档呢?
读取bz2文件
请使用bz2file这个第三方模块!一定不要使用python自带的bz2模块!
因为python官方的bz2模块不能处理multi-stream files,而不少大文件都是用这种方式压缩的。所以,为了避免不必要的麻烦,统一使用bz2file这个第三方模块吧.
用这个模块将bz2文件打开后,可以类似于普通的文本文件一样处理,详细用法见上面链接中的Documentation
样例代码如下:
#!/usr/bin/python
# -*- coding: UTF-8 -*-
import bz2file
import os
if __name__ == "__main__":
inpath = os.path.join(".", "data", "wikidata-20151130-all.json.bz2")
infile = bz2file.open(inpath, "r")
for i in xrange(3):
print(infile.readline())
这里,假设我们将wikidata的dump存储在”./data”文件夹下。
首先,我们用bz2file.open打开bz2文件。这里”r”表示读,”w”表示写。
当一个文档特别大的时候(比如wikidata等知识库的dump),往往会采用bz2或者gz对其进行压缩,方便下载,同时减少存储空间(bz2压缩率更高一些)。那么,如何不用解压也能读取原来的文档呢?读取bz2文件请使用bz2file这个第三方模块!一定不要使用python自带的bz2模块!因为python官方的bz2模块不能处理multi-stream files,而不少大文件都是用这种方式压缩的。...
File "/usr/lib/
python
3.6/tarfile.py", line 1678, in
bz2
open
raise ReadError("not a bzip2 file")
tarfile.ReadError: not a bzip2 file
tar = tarfile.open(tar_pat
那么我们可以利用
python
生成全部的六位数字密码
这样,我们就生成了一个从000000到99999的密码表。最后,如果你的时间不是很紧张,并且又想快速的提高,最重要的是不怕吃苦,建议你可以联系维:762459510 ,那个真的很不错,很多人进步都很快,需要你不怕吃苦哦!大家可以去添加上看一下~
并把它们存入到 passdict.txt 的
文件
中。
6位的密码表就这么大!!!
下一步做什么?
使用
Python
破解rar压缩包密码需要使用第三方库,例如rarfile。可以使用rarfile库的RarFile类的extractall方法,通过枚举密码的方式破解rar压缩包的密码。代码示例如下:
import rarfile
rar = rarfile.RarFile("sample.rar")
password_list = ["password1", "password2", "pa...