手机版
您的当前位置: 钻爱网 > 书信 > 通知 > 关联规则算法 谈两种关联规则算法在中医药治疗方面的应用及比较

关联规则算法 谈两种关联规则算法在中医药治疗方面的应用及比较

来源:通知 时间:2019-11-03 08:03:11 点击:

谈两种关联规则算法在中医药治疗方面的应用及比较

谈两种关联规则算法在中医药治疗方面的应用及比较 关联规则反映一个事物与其他事物之间的相互依存性和关联性。而关联规 则挖掘则是数据挖掘中最活跃的研究方法之一,其本质是要找出隐藏在数据间的 相互关系。关联规则数据挖掘的步骤主要有两步: 找出所有支持度大于或等于规 定最小支持度的频繁项集,再由频繁项集产生所期望的关联规则。其关联规则的 产生由支持度和置信度决定。在中医药领域,数据挖掘技术可用于证候诊断、方 剂配伍、文献研究、临床病历等方面,以辅助传承中医文化,指导现代中医的发 展。在目前针对中医药领域的数据挖掘中,关联规则Apriori 算法和FP-growth 算 法倍受研究人员的青睐。

1 概念 Apriori 算法为布尔关联规则挖掘频繁项集的原创性算法。该算法属于宽 度优先算法,使用逐层搜索的迭代方法,其中k 项集用于探索( k + 1) 项集。首 先,扫描整个数据库,累计每个项的计数,找出满足最小支持度的项,得到频繁 1 项集的集合L1。接下来循环进行以下两步: 连接步,产生候选项集Ck;
剪枝步, 根据先验性质频繁项集的所有非空子集也一定是频繁的,剪除( k - 1) 项子集不 在Lk - 1中的候选k 项集,当Lk为空时终止循环。

FP-growth 算法则是一种不产生候选项目集而采用模式增长的方式挖掘 频繁模式的算法。通过两个步骤来完成: 构造频繁模式树FP-tree 和调用 FPgrowth算法进行频繁项集挖掘。其原理是通过把每个事物映射到FP 树中的一 条路径将数据库压缩到一颗频繁模式树,但仍保留项目集关联信息,然后将这种 压缩后的数据库分成一组条件数据库,每个关联一个频繁项,并分别挖掘每个数 据库。对于每个模式片段,只需要考察与它相关联数据集。因此,随着被考察的 模式的增长,这种方法可以显著压缩被搜索的数据集的大小。

2 在中医药领域的应用 2. 1 方剂配 伍规律的研究方剂配伍规律能阐明方剂与病证之间治法的关系,揭示构成 方剂的诸要素与功效之间的关系。关联规则数据挖掘可以辅助认识方剂的效用和 方内各药物之间的配伍关系,揭示方剂效用的物质基础和作用机制,进而发现方 剂的潜在功效和新用途,以便改进传统剂型,研发复方新药。采用Apriori 算法对《中医方剂大辞典》中治疗不同疾病的方剂进行挖掘分析,得到针对不同疾病 的相应组方规律、核心药物、高频药对及药物功效配伍规律等。例如对其中587 首 肿瘤方进行挖掘。结果表明,肿瘤方中理气和活血药物使用频率最高,支持度高 的药对多为活血药与行气药配伍,支持度前20 的药组都含有活血化瘀药,且大 多为活血化瘀药与理气药配伍应用。最终发现《中医方剂大词典》所收录的肿瘤 方常选用的药物多具有行气止痛、活血化瘀、补气健脾的功效。对治疗肺痿疾病 的方剂进行组方规律分析,揭示了肺痿组方中药物关联规则,并根据关联结果进 行新方分析,得到9 个核心组合和9 个候选新方,为临床治疗肺痿提供了核心组 合及候选方剂。应用单味药药对药组的数据挖掘思路,从简单到复杂,对四物汤 中4 味药物的配伍关系进行挖掘,发现四物汤中当归是联系其他药物的中心环节, 而当归地黄为方中的核心药对,同时为方剂配伍规律的研究提供了新的思路和方 法。对治疗痛经的217 首方剂进行药对应用规律挖掘,得到当归川芎等高频药对, 而它们也是治疗针对寒凝血瘀和气滞血瘀型痛经的少腹逐瘀汤、温经汤两方的主 要组成药物,从而发现临床上痛经发病多为这两种辨证分型,为临床痛经的辨证 施药提供参考。在Apriori算法支持度、置信度的基础上再引入兴趣度概念,用以 修剪无趣的规则,挖掘出更有意义的关联规则,并以脾胃类方剂库中的1 060 首 方剂为例使用Apriori算法进行试验,通过设置兴趣度值排除无意义的药对人参甘 草,得到固定药对白术茯苓和尚未作为药对使用但具有客观关联性的茯苓木香药 物组合,提出如何利用这些相互关联的药物,是数据挖掘重点探讨的对象。

采用FP-growth 算法对《方剂》教材中的方剂进行挖掘来探讨中药复方配 伍的规则。以治风剂中的疏散外风剂为例得到方剂的配方规则,得到防风细辛、 甘草细辛、川芎细辛等药物组合,为疏散外风剂组方提供了参考。以解表剂为例 得到关系密切的中药组合,麻黄甘草、甘草芍药、桂枝芍药等,为解表药组方提 供了参考。采用该算法的改进算法FP-growth* 算法,在存在共享前缀的条件下, 遍历结点的第一个子女结点就发现共享前缀,减少搜索共享前缀的时间,从而减 少生成FP-Tree 的时间,以提高挖掘效率。并对取自华佗中医院的临床方剂和上 海市中医中药数据中心《中医方剂数据库》的脾胃方剂进行挖掘,得到脾胃方剂 的主药甘草、陈皮、白术、人参等,补气健脾方剂是最基本的用方,显示出脾胃 方剂遣方组药的一些规律。

2. 2 中药药性 药效的研究中药药性理论是中药基本理论的重要组成部分,也是指导临床 使用中药和阐释中药作用机制的重要依据。关联规则数据挖掘可以探讨中药药性四气五味与具体功效之间的关联关系,揭示四气五味的药性规律,为开发中药新 资源及指导临床用药提供理论线索。采用Apriori 算法对选自《中华本草》中8 980 味中药的四气数据及关联的药物功能进行关联规则挖掘,得到涉及温、平、寒三 性的分类关联规则11 条,揭示了中药温平寒药性规律。挖掘选取《神农本草经》 中的365 味中药,在建立气味效三维立方体的基础上,寻找气味效之间的关联规 则并进行初步分析,得到四气、五味及四气合五味与功效的关联规则,为中药药 性四气五味理论研究提供新思路和新方法。采用改进的Apriori 算法,对取自《中 国药典》《中药学》教材等书籍的中药药性及其他属性的相关数据进行挖掘,将 数据库划分成n 部分,针对每个部分单独产生一组频繁项集,然后将这些项集并 为一个总体的候选频繁项目集,再对其执行连接及剪枝等循环处理,直至产生强 关联规则。挖掘结果显示,药性与药味、归经、化学成分、功能、药理作用关系 最密切的依次为温辛、平肝、温挥发油、寒清热、温抗炎。通过中药药性与其他 属性间的关联进行初步探索,所得结果与中药药性传统认识相符,对中药的药性 分析具有指导意义。采用FP-growth 算法对含有596 味药、177 个不同功效的数 据进行效效关系挖掘。得到的结果表明,FP-growth 算法挖掘中药效效关系正确 率较高,60. 30% 基本符合中医知识和中医专家的经验;
发现感冒药材间关联规 则知识,得到3 味药材组合的配伍规律,体现了感冒药材之间存在客观的药性相 互作用,并据此编排设计了新的中药斗谱,提供了探索中药斗谱内外布局编排设 计的新思路。

2. 3 中医治 法用药规律中医强调辨证论治,即根据证的不同采取不同的治法及方药, 并通过古代及当代名医的积累总结产生了许多针对特定病证或证候的治法。关联 规则数据挖掘可以探索某一特定中医治法潜在的用药规律,通过其内在的药物联 系更深入地剖析中医治法的根本,为中医治法在临床应用和改进上提供有力的理 论依据。

采用Apriori 算法,对检索医学数据库中以滋阴补肾法治疗脑卒中恢复期 的临床研究报道得到的16首方剂,分析方剂中药对的应用规律,得到使用频率较 高的药对牛膝桑寄生,牛膝地龙等,与中医经典记载及临床应用相吻合。对检索 中国知网、中国生物医学文献数据库中有关运用清热、活血方为主的熏洗法治疗 痔病术后恢复期的临床研究报道得到的87 首方剂,得到应用频率较高的药对苦 参黄柏,苦参当归等,并发现清热药和活血化瘀药物的使用频次、药对配伍最多, 对痔病术后预防和缓解并发症疗效确切,治愈率高,可以有效指导临床实践。对检索医学数据库中以补肾益气活血化瘀法治疗脑卒中恢复期的临床研究报道得 到的18 首方剂,得到支持度较高的药对黄芪川芎,黄芪水蛭等,发现补肾益气 活血化瘀法治疗脑卒中恢复期的用药规律,为临床提供有效的理论指导。

2. 4 名老中医 医案挖掘名老中医医案是将中医理论与临床实践相结合并不断创新的结 果,包含了中医的基本原则和名老中医的独特见解,为中医的传承提供了宝贵资 源。关联规则数据挖掘可以分析记录这些名老中医临床诊疗经验的医案,发现他 们诊疗方式及辨证用药的独特性,为更好地指导临床工作奠定了理论基础。

采用Apriori 算法对收集自中医肾病专家聂莉芳治疗CRF( 慢性肾功能衰 竭) 患者的门诊及病房病案,对症状、中药、方剂及其相互关联进行分析挖掘。

结果说明,慢性肾衰病机气阴两虚证最为多见,并得到治疗CRF 常用中药、常 用药对药组和常用方剂等,体现了抓主症选方、随症加减的用药规律,为CRF 在 中医临床的诊疗提供了可靠的依据。以颜正华教授治疗胃脘痛的临床处方为研究 数据,采用Apriori算法提取关联规则,得到药物的核心组合和新处方,为传承和 深入挖掘名老中医的治疗方法提供了参考。以中医院中名老中医关于典型的Ⅱ型 糖尿病医案为研究对象,构建了基于Apriori 算法的数据挖掘平台,挖掘名老中 医关于Ⅱ型糖尿病的医案中药物之间的相互关联,得出治疗Ⅱ型糖尿病最常用的 中药和药对,为Ⅱ型糖尿病在中医临床诊疗提供了宝贵经验。

3 结语 在现有中医药领域的关联规则数据挖掘中,就算法本身来说,有实验证明 在支持度较小的情况下,FPgrowth算法较Apriori 算法有着明显的优势。Apriori 算法易于实现,但在实际应用中存在一些难以克服的缺陷,频繁扫描数据库、产 生大量候选项集等;
FP-Growth 算法可以实现对无向项集图的实时构造,无需频 繁扫描数据库,算法性能显著提高。就算法应用来说,Apriori 算法多于FP-growth 算法。作为原始经典算法之一的Apriori 算法已广泛应用于中医药方剂配伍、药 性药效、中医治法、中医医案等多方__面的挖掘当中,挖掘结果也基本与中医经 典记载和临床经验相吻合;
而FP-growth 算法明显在应用上不及Apriori 算法,应 用范围相对较局限。总体来说,两种算法的运用大部分还停留在小范围数据的理 论阶段,尚未有大范围数据的关联规则挖掘,其结论的应用也相对局限,能为相 应领域提供一定理论指导,但尚未真正应用到临床实践中。随着中医药数据库的 逐步建立和完善,关联规则Apriori 算法和FP-growth 算法挖掘将有更加全面的数据支持,探索结果也将会更加准确实用,指导性和实践性提高,必定会对数据 挖掘在中医药领域的发展有极大的推动作用。

推荐内容

钻爱网 www.zuanai.cn

Copyright © 2002-2018 . 钻爱网 版权所有 湘ICP备12008529号-1

Top