python实现CNKI知网爬虫

最近需要用到CNKI知网的爬虫爬取相关论文的信息,在网上搜索了一下,在GitHub上找到了之前大神写的知网爬虫,但是可能由于知网更新了接口,这个爬虫现在不能使用,于是打算自己动手写一个。因为是第一次写爬虫,全当是练手了。写的不对的地方,还请大家批评指正!

使用BeautifulSoup

要实现爬虫,首先要选取合适的库,当然也可以纯写,只不过有点费时费力。百度之后,发现BeautifulSoup库的相关文档很清楚,上手简单。而我在实现Cnki_Spider的过程中基本上就用到了这个库中的两三个方法,个人觉着在知网爬虫中,这个库已经足够使用。
在使用时只需要import即可,如果报错的话,需要使用pip命令安装一下。

1
from bs4 import BeautifulSoup

找到合适的知网接口

找到爬虫工具之后的重中之重就是找到一个适合我们使用的接口,找了一些其他人写的爬虫后发现,这个接口非常好用,他不会像知网主页上面把所有的搜索结果都嵌套在一个iframe中,而且搜索结果与知网相差无几。
知识搜索
知网
在这张图里就可以看到知识搜索中的所有搜索结果都可以直观获取到。

使用如下语句就可以轻松愉快地获取该页面所有内容(Python版本3.x)。

1
2
html = urllib.request.urlopen(page_url).read()
soup = BeautifulSoup(html,'html.parser')

爬虫架构

因为在搜索页面中没有作者信息,摘要内容也不全,所以我们只能在这页面中爬取文章链接、文章标题、文章出处、年份以及下载次数、引用次数信息。在爬取的过程中,大部分时间其实都是在做字符串处理。
例如使用all = soup.find_all('div', class_='wz_content')这条语句就可以获取搜索页面中全部的结果信息,使用item = string.find('a', target='_blank')#文章标题与链接语句就可以获取到文章的标题和详情链接。
将这页获取到的信息保存在文本文件中,方便我们进入文章详情页面进行爬取。因为一个搜索页面显示15条信息,所以我们还可以自己设置爬取页面数量等信息。
在文章链接爬取完成后,可以按照文章链接对文章详情页面进行爬取,因为用到的技术和前面类似,所以也不再赘述。
爬取后的结果如下:

1
2
3
4
5
6
7
8
9
10
http://cdmd.cnki.com.cn/Article/CDMD-10570-2010020435.htm	微小残留白血病监测的研究	广州医学院  硕士论文  2009年	下载次数(447)| 被引次数(0)	梁洁芳   	【摘要】:	研究背景	随着对白血病认识的不断深入,白血病的诊断、治疗和预后等水平也不断提高。儿童及成人急性淋巴细胞白血病(acuteleukemia,APL)的CR率达85%。但是,目前仍有部分经治疗后获得完全缓解的患者在数年之内复发。	白血病初诊时,患者体内的白血病细胞数量约为1012,经化疗取得临床及血液学完全缓解后,体内仍存在106~108个残留白血病细胞,这些存在于体内的形态上不能检测到的白血病细胞称为微小残留白血病(MinimalDisease,MRD),是引起白血病复发的主要原因之一。因此,在白血病治疗过程中准确测定MRD并分析其意义,对临床追踪病情、判断预后、制定治疗方案等,具有重要意义。	在白血病治疗过程中准确测定MRD并分析其意义,具有如下意义:①根据体内白血病细胞的负荷决定是继续治疗还是停止治疗;②更早地发现化疗药物的耐药性;③更早地预测白血病复发;④评价骨髓移植的预处理效果;⑤为体内残留白血病细胞分布和增殖动力学的研究提供可能性。	白血病MRD检测,必须符合以下条件:①敏感度至少为10-3(即可在103个正常细胞中检出一个白血病细胞);②所采用的检测标志比较稳定,不会随病程改变而导致假阴性或假阳性结果;③不同实验室之间的检查结果具有可重复性及可比性;④检测方法易于在临床推广应用。	目前用于检测MRD的方法主要有核型分析、荧光原位杂交(fluorescenceCt)和标准曲线的分析对起始模板进行定量分析,具有敏感度高、准确定量、简便快速,污染较少等优点,是目前最为理想的MRD定量检测方法。	检测白血病MRD的靶标志之一融合基因是由于染色体结构改变导致的分子水平的异常,目前已发现超过50种与白血病有关的融合基因异常,这些异常已成为不同类型白血病的分子生物学特异性标志,可作为临床上对白血病进行分型、预后判断和残留病追踪的依据。由欧洲10个国家26个实验室共同参与研究制定的“欧洲防癌计划”(Europeprogram,EAC),通过以FQ-PCR方法检测9种主要的白血病特异融合基因,建立了一套标准化的MRD定量检测方法,并初步评价该方法的敏感度、特异性和重复性,为大规模的临床实验研究建立了方法学基础。该标准化方法在儿童及成人ALL及AML中的检出率达30%~40%,在CML中超过95%。	尽管以FQ-PCR检测白血病融合基因已应用于临床,但仍存在下列问题:①对一项检测方法的评价,应在严格的质量控制的前提下,对实验结果进行真实性(包括敏感性、特异性和约登指数)和可靠性(主要以变异系数表示)等方面的评价,而目前的文献中,仅见对FQ-PCR检测白血病融合基因的检测方法进行敏感性、特异性和可靠性的评价,而未见质量控制等方面的报道;②在引物、探针、内参基因的选择等技术问题上尚未达成一致;③目前国际上尚未统一各种白血病融合基因的表达水平与临床分级和预后的关系。	我们通过前期研究,已分别构建了含BCR-ABLM-bcr、TEL-AML1、PML-RARα和AML1-ETO等4种白血病融合基因的表达量,并通过对检测结果进行室内质量控制和误差分析,以及真实性和可靠性的判断,对FQ-PCR检测白血病融合基因进行方法学的评价。在此基础上,应用FQ-PCR检测初诊白血病患儿的相关融合基因,并在治疗过程中对融合基因的表达量进行初步追踪观察,为临床应用FQ-PCR监测白血病MRD奠定基础。	研究目的	1.通过细胞水平的研究,对FQ-PCR定量检测白血病融合基因进行全面的方法学评价。	2.以FQ-PCR定量检测初诊白血病患儿的相关融合基因,对阳性者,追踪观察其在白血病治疗过程中的变化,为进一步临床研究奠定基础。	研究内容	1.选取K562细胞(含BCR-ABL融合基因)、REH细胞(含TEL-AML1融合基因)、NB4细胞(含PML-RARα融合基因)和KASUMI-1细胞(含AML1-ETO融合基因)作为阳性细胞,以HL-60细胞(不含上述白血病相关融合基因)作为阴性细胞,将上述4种细胞分别梯度稀释为1:100~1:1056个浓度,以FQ-PCR检测相应融合基因的相对表达量。	2.根据上述检测结果,通过计算SI值、灵敏度和变异系数(coefficientvariation,CV),对实验研究进行室内质量控制和误差控制的分析。	3.通过计算敏感性、特异性、约登指数和CV,判断检测方法的真实性和可靠性。	4.以FQ-PCR检测初诊白血病患儿的相关融合基因,阳性者,在治疗过程中继续追踪观察相关融合基因表达量的变化。	技术路线	1.细胞水平研究	2.临床观察	研究方法	1.细胞水平的研究	(1)培养K562细胞、REH细胞、NB4细胞和KASUMI-1细胞。	(2)用HL-60细胞作为阴性细胞梯度稀释上述4种细胞,其稀释浓度为1:100~1:105。	(3)提取上述细胞RNA,并逆转录为cDNA。	(4)以含BCR-ABLM-bcr、PML-RARα、AML1-ETO和TEL-AML1等4种融合基因,通过质粒标准品的标准曲线及标准方程得出融合基因的相对表达量(融合基因拷贝数与内参基因拷贝数之比),以NCN表示。	(5)上述实验每组设3个复管,连续3天重复实验,即每种细胞每一浓度可获得9个实验数据。从第三次实验开始进行“即刻法”质控,直至第九次实验结束。根据实验结果计算SI值、批内CV、批间CV和灵敏度,进行室内质量控制和误差控制的分析。	(6)计算敏感性、特异性、约登指数、批内CV和批间CV,评价检测方法的真实性和可靠性。	2.临床观察	(1)采集经骨髓细胞形态、免疫分型确诊的初诊白血病患儿骨髓并抽提RNA,制备cDNA。	(2)FQ-PCR定量检测7种白血病相关融合基因。	(3)白血病相关融合基因阳性者,于诱导缓解治疗后追踪融合基因表达量的变化。	研究结果	1.质粒标准品经FQ-PCR检测后,生成标准曲线、标准方程、相关系数r2及扩增效率(见表5)。	2.FQ-PCR检测白血病融合基因的结果显示:①当细胞浓度在1:100~1:105范围时,细胞浓度与待检融合基因的Ct值呈负相关;②细胞浓度每下降1个对数级,其待检融合基因的NCN值相应下降0.5~1个对数级,两者之间的相关系数r2在0.985~0.986之间,,呈高度正相关;③内参基因的Ct值在21.86±0.05~26.48±0.73范围之间。	3.每种细胞每一浓度的第九次实验结束后,其NCN的SI上限值和SI下限值均小于Q2s。	4.FQ-PCR检测4种细胞系相关融合基因的灵敏度均为10-5。	5.FQ-PCR检测白血病融合基因,敏感度以TEL-AML1和AML1-ETO最高(100%),BCR-ABLM-bcr最小(0.79)。	6.在被检的4种融合基因中,KASUMI-1细胞浓度为1:100~1:105时,其AML1-ETO融合基因NCN值的批内CV和批间CV均小于3%,可靠性最好;K562、REH和NB4细胞浓度为1:100~1:103时,其相关融合基因NCN值的批内CV和批间0CV均小于10%,可靠性较好,在细胞浓度为1:104~1:105时,其相关融合基因NCN值的批内CV小于6%,可靠性也较好,而批间CV则小于30%,可靠性逊于上述。	7.收集初诊白血病标本55例,FQ-PCR检测初诊白血病患者融合基因的检出率为28.57%,其中初诊ALL的检出率为15.38%,AML的检出率为14.29%,APL和CML的检出率均为100.00%。	8.对6例APL患儿予诱导缓解化疗,2例CML患儿予格列卫治疗,取得CR后继续以FQ-PCR追踪PML-RARα和BCR-ABL融合基因的NCN值,结果见表12和表13。	结论	1.每种白血病细胞稀释为1:100~1:1056个浓度,每一浓度设3个复管,连续检测3天,所获得的全部数据均在可控范围内。	2.细胞浓度每下降1个对数级,其待检融合基因的NCN值相应下降0.5~1个对数级,两者之间的相关系数r2在0.985~0.986之间,P0.001,呈高度正相关性。	3.FQ-PCR检测白血病融合基因的灵敏度为10-5,与国外文献报道一致。	4.FQ-PCR检测白血病融合基因,敏感度以TEL-AML1和AML1-ETO最高,为100%,BCR-ABLM-bcr最小(0.79)。	5.当KASUMI-1细胞浓度在1:100~1:105范围时,FQ-PCR检测AML1-ETO融合基因的NCN值的批内CV和批间CV均小于3%,可靠性和精密度最好;K562、REH和NB4细胞浓度为1:100~1:103时,FQ-PCR检测BCR-ABLM-bcr、TEL-AML1和PML-RARα的NCN值的批内CV和批间CV均小于10%,可靠性和精密度较好,在细胞浓度为1:104~1:105时,上述相关融合基因NCN值的批内CV小于6%,可靠性和精密度也较好,而批间CV小于30%,但仍在可控范围之内。	6.收集55例初诊白血病患儿的骨髓标本,FQ-PCR检测初诊白血病患者融合基因的检出率为28.57%,其中初诊ALL的检出率为15.38%,AML的检出率为14.29%,APL和CML的检出率均为100.00%。初步追踪观察融合基因水平变化与治疗反应一致。
http://cdmd.cnki.com.cn/Article/CDMD-10183-2004100542.htm 急性白血病合并糖尿病的临床分析 吉林大学  硕士论文  2004年 下载次数(181)| 被引次数(1) 郭伏平   【摘要】:急性白血病合并糖尿病临床上并不少见,根据国内外报道,高血糖已证明是未诊断糖尿病的白血病患者一项预后不良的独立指标。本文研究的目的是进一步了解白血病合并糖尿病糖代谢障碍的机制、临床特点、血糖代谢变化及其临床意义,判断高血糖对急性白血病患者生存率、缓解持续时间与和治疗相关的并发症的影响。方法:本文对我院1996-2004年39例急性白血病合并糖尿病患者与单纯随机抽样的31例急性白血病患者进行对比分析。本病例分析中糖尿病组男23例,女16例,男女之比为1.44:1,平均年龄为53.7±13.2岁,白血病分型:ANLL26例(M12例,M52例,M62例),ALL9例。两组的化疗方案和支持疗法相似,本组病例中糖尿病组分别采用低糖饮食、口服降糖药和胰岛素控制血糖,两组采用标准统计方法。结果:1、糖尿病组年龄显著大于对照组(P0.001),两组达超重指标的患者体重指数相比较无显著差异(P0.05)。2、糖尿病组糖尿病的发病时间可见于以下几种情况:(1)急性白血病初诊时确诊19例(48.7%)。(2)有糖尿病病史的8例(20.5%)。(3)急性白血病复发期发生糖尿病7例(17.9%)。(4)化疗骨髓抑制期发生糖尿病3例(7.8%),其中2例分别为强的松、左旋门冬酰氨酶治疗14天时发现,1例发生心衰、白血病全身浸润时血糖升高,诊断糖尿病两天后死亡。(5)化疗后骨髓缓解期发生糖尿病2例(5.1%)。3、临床表现:1)糖尿病组存在多饮、多食、消瘦等的WP=44高代谢症候群8例(20.5%),其中2例发生酮症酸中毒,占(5.1%),1例使用胰岛素治疗的患者发生低血糖症(2.6%)。2)糖尿病组发生感染的总例数为20例(51.3%),其中最常见的是败血症(17.9%),依次可见霉菌感染和呼吸道感染(各为15.4%),急性胃肠炎(12.8%),肛周感染、软组织蜂窝织炎、感染性休克(各为5.1%),胆囊炎(2.6%)。而对照组发生感染的例数为6例(19.4%)。糖尿病组感染发生率明显高于对照组(P0.05)。3)糖尿病组脾肿大发生率明显高于对照组(P0.05),而两组在肝、淋巴结肿大和中枢神经系统白血病的发生率无显著差异(均为P0.05)。4、辅助检查:1)糖尿病组患者的外周白细胞数、外周原始细胞百分与外周原始细胞数显著高于对照组(P0.05),糖尿病组外周血白细胞0.0×109/L的患者所占比例明显高于对照组(P0.05),两组患者的血红蛋白值和血小板数无明显差异(P.05)。2)糖尿病组骨髓像中糖尿病组原始细胞百分比值显著高于对照组(P0.05)。3)糖尿病组诊断时的空腹血糖显著高于对照组(P0.001)。死亡患者空腹血糖水平显著高于未死亡患者(P0.05)。20例感染患者的空腹血糖水平显著高于19例未感染患者(P0.05)。5、治疗效果:单纯饮食控制、口服降糖药治疗、胰岛素治疗三种降糖治疗之间无显著差异(P0.05)。其中治疗上以胰岛素治疗为主(50%),其次为口服降糖药(31.2%),单纯饮食控制为18.8%。血糖控制水平以差为主,比例为68.7%,控制理想者为31.3%。2)糖尿病组10例完全缓解(37.0%),2例部分缓解,缓解率占44.4%,而对照组15例完全缓解(78.9%),2例部分缓解,缓解率占89.5%,对照组的缓解率显著高于糖尿病组(P0.05)。糖尿病组死亡患者为19例,占总数的51.4%。而对照组死亡患者为6例,占总数的31.6%,糖尿病组死亡率显著高于对照组(P0.05)。WP=45综上所述,得出以下结论:1、急性白血病合并糖尿病的白血病类型构成中以AML占的比例大,男性多于女性,糖尿病多在急性白血病初诊时诊断。2、急性白血病合并糖尿病的危险因素包括年龄60岁和糖尿病家族史。3、急性白血病合并糖尿病的病因考虑以下因素有关:大量白血病细胞对胰岛的损害、严重感染出血时的应激反应、化疗药物和糖皮质激素引起的医源性胰岛功能受损、潜在的胰岛β细胞功能不足等。4、急性白血病合并糖尿病缺少典型的糖尿病症状,糖尿病酮症酸中毒少见,以急性白血病症状为主,临床上易漏诊。急性白血病合并糖尿病易发生感染。5、急性白血病合并糖尿病时糖尿病治疗以原发病为主,同时根据患者血糖水平选择适当的降糖治疗方法。6、急性白血病合并糖尿病患者白血病化疗缓解率降低、死亡率增高,预后不良。因此,在白血病的治疗过程中,应密切观察血糖变化,及时预防和治疗糖尿病,以改善白血病的预后。
http://cdmd.cnki.com.cn/Article/CDMD-10285-2005135534.htm 4-1BBL逆向信号对M5型白血病细胞株生物学行为的调节作用及其机制 苏州大学  硕士论文  2005年 下载次数(43)| 被引次数(0) 周斌   【摘要】:4-1BBL(4-1BBLigand)分子又名CD137L,其受体为4-1BB(CD137),4-1BBL/4-1BB为共刺激分子家族中的重要成员。4-1BBL逆向信号的激发可以有效地活化单核细胞,促进单核细胞的增殖和分化。业已报道,在一些肿瘤细胞表面也有4-1BBL分子的表达,其中某些T和B系白血病肿瘤细胞上组成性表达4-1BBL分子,且4-1BBL分子的激发可提高白血病细胞增殖和生存能力,这为研究白血病的发病机制及寻找白血病的治疗策略提供了新的途径。鉴此,本文以表达4-1BBL分子的人急性单核系白血病(M5型白血病)细胞株SHI-1为研究对象,通过体内外实验,分析了4-1BBL分子的激发对SHI-1细胞的作用影响,为M5型白血病的进一步研究与治疗提供依据。一、4-1BBL分子在人M5型白血病细胞株SHI-1上的表达及其生物学意义通过流式细胞术对M5型白血病细胞株SHI-1上4-1BBL分子的表达水平进行检测。结果表明,4-1BBL分子高表达于该细胞表面。采用激发型4-1BBL单克隆抗体(1F1)体外与SHI-1细胞共培养后,检测细胞的生长与增殖,结果显示,在浓度为5μg/ml的抗体作用下,SHI-1细胞出现明显的增殖效应。由此提示,激发型抗人4-1BBLmAb介导的4-1BBL逆向信号对SHI-1细胞的生长具有促进作用。二、人M5型白血病-SCID小鼠模型的建立及其生物学特性的分析
http://cdmd.cnki.com.cn/Article/CDMD-10678-2003112905.htm RT-PCR检测WT1基因在白血病患者中的表达及临床意义 昆明医学院  硕士论文  2003年 下载次数(122)| 被引次数(0) 聂波   【摘要】:[目的]研究WT1基因在白血病患者中的表达情况及其临床意义。运用逆转录-聚合酶链反应(RT-PCR)的方法,检测WT1基因在50例白血病患者及8例正常人、3例血液系统非恶性肿瘤患者中的表达。分析WT1基因在白血病患者中的表达规律,及其与白血病转归、预后等的关系。RT-PCR检测WT1基因的灵敏性为10~(-4)。急性非淋巴细胞白血病(ANLL)22例中有17例(77.3%),急性淋巴细胞性白血病(ALL)11例中有6例(54.5%),及急性混合细胞性白血病(AMLL)1例WT1基因表达阳性,且FAB分型中各型急性白血病均可呈阳性表达。慢性粒细胞白血病(CML)15例,其中慢性期8例WT1基因表达均为阴性,急变期9例,5例WT1基因表达阳性(55.6%)。其表达与CML的病情演进有关。浆细胞白血病1例(PCL)WT1基因表达阴性。8名正常人及3例血液系统非恶性肿瘤疾病患者WT1基因表达均为阴性。可见WT1表达与白血病转归有关,可先于临床提示复发;且WT1基因表达阳性患者缓解率(CR+PR)低于表达阴性者(分别为31.3%和69.2%,P<0.05)。[结论1wTI基因的表达可见于各种类型的白血病,而无论其有无特异性肿瘤标志。动态观察发现wTI基因的表达具有一定的规律性,可作为临床评估预后、检测微小残留病(MRD)的泛白血病基因标志及CML病程演进的指标。
http://cdmd.cnki.com.cn/Article/CDMD-10183-2005105432.htm 外周血微小残留白血病细胞的定量检测及临床应用 吉林大学  硕士论文  2005年 下载次数(93)| 被引次数(0) 李燕   【摘要】:急性白血病患者经化疗或造血干细胞移植后,多数可以获得完全缓解,但是仍有许多患者在完全缓解后复发,导致白血病复发的根源是微小残留白血病(MRL)的存在,此时体内残留的白血病细胞称为微小残留白血病细胞(MRLC)。MRLC的实验室诊断方法,对于白血病的治疗、疗效评价、预后判断和复发监测都具有十分重要的临床意义。本研究以FLT3
http://cdmd.cnki.com.cn/Article/CDMD-10678-2004109993.htm 同源盒基因A_(10)在急性白血病中的表达及相关研究 昆明医学院  硕士论文  2004年 下载次数(42)| 被引次数(0) 黄颖   【摘要】:[目的]探讨HoxA_(10)基因在急性白血病患者中的表达及其临床意义。mRNA的表达水平。分析其在急性白血病中的表达规律及与临床预后的关系。HoxA_(10)在各型急性髓系白血病中均表达,在急性淋巴细胞白血病和部分对照也低表达。3例正常人不表达HoxA_(10)。其mRNA表达水平在急性髓系白血病明显高于急性淋巴细胞白血病和对照组,P<0.01。在急性髓系白血病中,M1型和M2型表达水平高于M4型M5型、M3型有显著高表达。骨髓中原、幼细胞比例和HoxA_(10)mRNA表达水平呈正相关关系,r=0.635,P<0.01。未缓解组9例患者HoxA_(10)水平高于缓解组8例患者,但无显著差异,P=0.258。1例M2患者和1例M5患者缓解后HoxA_(10)不表达。
http://cdmd.cnki.com.cn/Article/CDMD-10183-2005107009.htm 白血病DcR3与c-myc、bcl-2 、PTEN基因表达的相关性研究 吉林大学  硕士论文  2005年 下载次数(168)| 被引次数(0) 陈鹏   【摘要】:目的:研究DcR3
http://cdmd.cnki.com.cn/Article/CDMD-10572-2000002265.htm 清毒饮和养正片对白血病细胞凋亡的作用及其机理研究 广州中医药大学  博士论文  2000年 下载次数(929)| 被引次数(1) 潘习龙   【摘要】:急性白血病属于中医虚劳、血证、温病等范畴,其发病原因为精气内虚、温热毒邪炽盛,发病机理不外乎邪毒内蕴、正气虚弱、血行瘀滞、痰邪凝滞,临床采用辨证和辩病的方法,给予扶正、解毒、化瘀及砷剂等治疗。导师组根据多年的工作经验,认为急性白血病的本质为正虚邪盛,正虚邪盛贯穿于白血病的全过程,治疗上应清热解毒、凉血止血、活血化瘀、化痰散结与补气养血、滋阴填精兼顾,在中医理论指导下,拟定了治疗急性白血病的两个复方清毒钦和养正片,清毒饮以清热解毒、凉血止血、活血化瘀、化痰散结的药物组成,养正片以益气养血、滋阴填精的药物组成,清毒饮中大部分药物具有抗肿瘤作用,即细胞毒作用,养正片以改善机体免疫功能的药物为主组成,通过改善机体的免疫功能而起到间接抗肿瘤的目的。根据中医辨证用于急性白血病的不同证型,可与化疗同时应用,起到增效减毒的作用,也可单独应用于化疗间歇期或不适宜化疗者,经临床观察证实有较好的疗效,以往的实验研究也证实清毒饮和养正片可延长荷瘤小鼠生存期,改善小鼠免疫功能,提高IL-2、IL-6、TNF-α活性及其mRNA表达。细胞凋亡是机体维持自身稳定的一种基本生理机制。机体通过细胞凋亡消除损伤、衰老与突变的细胞,维持生理平衡,当组织细胞凋亡异常时,可导致各种疾病的发生。目前,国内外对细胞凋亡的基础研究及其在疾病诊疗-2.中的应用研究,正越来越受到医学界的重视。细胞凋亡在白血病的发生发展中起重要作用,白血病细胞的凋亡是减少的,而细胞凋亡是由基因编程控制的,Be12、P53、Fas等癌基因与白血病细胞凋亡有较密切关系。诱导凋亡是白血病治疗的一个重要途经,某些中药可能具有诱导凋亡的作用,其作用机制是目前研究的一个热点。12白血病小鼠模型,用原位末端标记法(TUNEL)观察清毒饮、养正片及化疗对L72的白血病细胞凋亡的影响,并同时观察了小鼠肝、脾指数的变化,结果发现清毒饮组、化疗组的肝、脾指数均较模型组有减小(P<0.05),清毒饮组优于养正片组,与化疗合用则肝脾指数减小更明显叩刃),表明清毒饮、养正片有一定抗白血病作用,且与化疗合用有增效作用,TUNEL结果发现清毒饮组、养正片组、化疗组都可见较多凋亡阳性白血病细胞,清毒饮组优于养正片组,与化疗合用则更明显,凋亡指数均大于模型组(P(0.of),证明清毒饮、养正片具有诱导L7212的白血病细胞凋亡的作用,以清毒饮组较明显,且可以提高化疗的诱导凋亡作用。这或许是临床治疗白血病的机理所在。用免疫组织化学方法检测小鼠L7212白血病骨髓有核细胞的BCL-2、P53、Fas的表达,结果显示BCL-2蛋白表达明显增高,给予清毒饮、养正片处理后,BCL-2有所下降,以清毒饮组下降较养正片组明显,与化疗合用后下降更明显(P<0.05);L7212白血病有Fas表达减低,给予清毒饮、养正片、化疗处理后FAS有一定升高,清毒饮组亦较养正片组明显,清毒饮加化疗组则尤其明显(P<0.oi),而L7212白血病细胞稍减低,经清毒饮、养正片、化疗处理后,P53表达的阳性率及表达强度均有所升高,也以清毒饮组较明显,与化疗合用后升高更明显,但统计学处理差异无显著性意义(P>0.05),酶联免疫吸附试验法(ELISA)检测sEas显示与模型组比较,清毒饮组明显降低(p<0.05),养正片组则无明显变化:与空白组-3-比较,清毒饮组则无明显变化,养正片组则明显升高…狈.05厂以上表明清毒饮、养正片确能下调BCI。-2的表达水平,提高FAS的表达水平,而对P53作用不甚明显,清毒饮可使sEas的水平降低,养正片对sEas的作用较弱,这可能是清毒饮、养正片诱导细胞凋亡的机制所在。总之,本研究表明清毒饮、养正片有诱导白血病细胞凋亡的作用,且清毒饮较养正片明显,清毒饮、养正片与化疗结合可以提高化疗的诱导凋亡作用,这也许是临床治疗自血病有较好疗效的原因之一,清毒饮、养正片通过下调BCLZ表达,提高FAS表达而诱导细胞凋亡,清毒饮、养正片对P53的影响尚不够明显。
http://cdmd.cnki.com.cn/Article/CDMD-10285-2004031637.htm 红细胞生成素受体在急性白血病中的表达及意义 苏州大学  硕士论文  2003年 下载次数(51)| 被引次数(0) 凌云   【摘要】:目的:探讨红细胞生成素(EPO)受体(EPO-R)在急性白血病细胞上的分布表达及意义,以及重组人EPO(rhEPO)对急性白血病细胞增殖的影响。方法:应用独特型EPO-R单克隆抗体,通过流式细胞仪技术检测30例急性白血病(AL)患者的骨髓单个核细胞EPO-R的表达,用细胞周期DNA分析法研究rhEPO单独对AL细胞增殖的影响。结果:30例AL患者白血病细胞均有EPO-R表达,EPO-R表达率(4.63%±4.24%)明显低于作为对照组的24例特发性免疫性血小板减少性紫癜(ITP)或白细胞减少症患者(9.73%±6.92%),P<0.05。在22例初治的AL患者中,EPO-R表达较高(≥4.63%)的8例患者完全缓解率(CR)为50.0%,EPO-R表达较低(<4.63%)的14例患者CR率为71.4%,两组比较,无显著性差异(P=2.83)。18例AL患者的急性白血病细胞体外经rhEPO作用后未出现明显的增殖,与无EPO的对照组比较,无显著性差异(P>0.05),并且细胞增殖与细胞EPO-R的表达水平无相关性。红细胞生成素受体在急性白血病中的表达及意义中文摘要结论:急性白血病细胞表达EPO一R,但表达水平低,AML和ALL的EPO一R表达无差异。rhEPO在体外对急性白血病细胞无明显刺激增殖作用,并且细胞的增殖与细胞EPO一R的表达水平无相关性,该结果为临床应用rhEPO治疗急性白血病患者贫血的安全性提供了实验依据。EPO一R在急性白血病中的作用、生物学特性及与急性白血病患者的预后之间的关系尚需进一步的深入研究和探讨。
http://cdmd.cnki.com.cn/Article/CDMD-10285-2004132172.htm 多重RT-PCR检测儿童急性白血病融合基因的临床研究 苏州大学  硕士论文  2004年 下载次数(293)| 被引次数(0) 李建琴   【摘要】:目的研究儿童急性白血病染色体畸变所形成的融合基因与临床诊断、治疗和预后的关系。38例)进行研究。91例儿童AL中有41例(45.05%)具有13种克隆性基因重排,包括SIL/TAL1、E2A/PBX1、TEL/AML1、MLLex7/AF9、MLLex8/AF9、MLLex8/AF10、MLLex8/AFX、MLLex9/AF6、MLLex9/ELL、MLLex7/AF4、TLS/ERG、AML1-ETO、PML-RARα(L、S、V型)。其中53例儿童ALL中18例(33.96%)具有11种融合基因,38例AML中有23例(60.53%)具有4种融合基因。1例ALL患者同时表达两种融合基因MLLex7/AF9、MLLex8/AF9,1例ALL患者同时表达三种融合基因MLLex9/ELL,MLLex9/AF6,MLLex8/AFX。9例ALL、8例AML患儿有HOX11原癌基因活化,7例ALL、7例AML患儿为单纯表达HOX11原癌基因活化,2例ALL、1例AML同时伴有其他融合基因表达。本文中2例ALL表达t(12;21)即(TEL/AML1)患者顺利获完全缓解(CR)2年;1例t(1;19)即(E2A/PBX1)在诱导缓解期由于感染、经济困难放弃治疗而死亡;1例T-ALL,仅单纯表达HOX11基因活化,在疗程中复发(CR6月时,第一次加强强化后即复发),且产生顽固性耐药,最终死亡;1例高危(HR)B-ALL、t(10;11)(p12;q23)(MLLex8/AF10)合并HOX11活化的患儿,经有目的的强烈化疗后已达CR两年;另1例多重R卜PCR检测儿童急性白血病融合基因的临床研究中文摘要HR-ALL、t(9;11)(P22;q23)患儿,(MLLex7/A卫9,MLLexs/A卫9共存)经DOLD方案诱导巧天即达CR,现已CR14月;1例SIL月鸿工1表达的患者eRg个月;伴t(15;x7)、t(s;21)表达的20例患儿中接受化疗的11例全部达CR,且无复发。1例Ml伴Hoxll活化临床很难缓解,且CRZ月后复发死亡。结论呱C分型是白血病分型的常规,而基因分型是儿童AL最精确的分型方法,为临床化疗提供方向:TEL/A侧巳1、A侧比1一ETo、PNll‘-RARQ表达者预后良好;B.ALL合并HOXll活化近期疗效好‘;T-ALL合并HOXn及AN几表达HOXn者预后不良;有MLL基因重排的预后极差,需骨髓移植或强烈化疗,提示临床要有目的的加大化疗强度。采用多重Rl’-PCR方法可快速同时检测儿童急性白血病29种染色体畸变所形成的融合基因,完善白血病的呱CM分型、指导临床个体化治疗。多重RFPCR可快速全面从分子水平检测白血病患儿持续完全缓解(CCR)时的微小残留病变(M叹D),作为判断预后、白血病的长期无病生存田FS)一个重要的停药指标。

后续功能

  • 需要加入错误重试机制,在网络出现问题后能够及时重试。
  • 对爬取结果进行重新优化显示,输出到execl文件中。
  • 尝试加入文章下载功能,但是知网对频繁下载有限制,不一定会成功。
  • 考虑将爬取到的数据直接写入数据库中,方便存储以及后续操作。

增加的功能

增加了对作者单位、文章关键词的爬取,增加了对参考文献的爬取,如果需要爬取共引文献或其他文献,只需要将参考文献换为需要爬取的其他类别即可。

github下载点击这里,谢谢支持!

本文作者:Qiu Qingyu
版权声明:本博客所有文章除特别声明外,均采用CC BY-NC-SA 3.0 CN许可协议。转载请注明出处!
本文永久链接:http://qiuqingyu.cn/2017/04/27/python实现CNKI知网爬虫/