本发明公开了一种基于人工智能的结直肠癌病因调查方法,该方法为通过调查问卷与诊疗记录对病人数据进行收集,对获取的数据进行预处理,剔除噪点数据并补充空余数据,并运用稀疏矩阵投影方法处理多值数据。通过特征选择与特征降维的方法,结合该特征对患病概率的影响程度,剔除影响度较低的特征,再结合医学特征特点,选出重要性较大的特征。最后将数据输入人工智能算法,比较传统算法如线性回归、支持向量机、BP神经网络、朴素贝叶斯和随机森林的准确度,选择准确度最高的算法,再进行调参,提高准确度,得到具体特征指标与患癌风险之间的关系。
