设计 任务书 文档 开题 答辩 说明书 格式 模板 外文 翻译 范文 资料 作品 文献 课程 实习 指导 调研 下载 网络教育 计算机 网站 网页 小程序 商城 购物 订餐 电影 安卓 Android Html Html5 SSM SSH Python 爬虫 大数据 管理系统 图书 校园网 考试 选题 网络安全 推荐系统 机械 模具 夹具 自动化 数控 车床 汽车 故障 诊断 电机 建模 机械手 去壳机 千斤顶 变速器 减速器 图纸 电气 变电站 电子 Stm32 单片机 物联网 监控 密码锁 Plc 组态 控制 智能 Matlab 土木 建筑 结构 框架 教学楼 住宅楼 造价 施工 办公楼 给水 排水 桥梁 刚构桥 水利 重力坝 水库 采矿 环境 化工 固废 工厂 视觉传达 室内设计 产品设计 电子商务 物流 盈利 案例 分析 评估 报告 营销 报销 会计
 首 页 机械毕业设计 电子电气毕业设计 计算机毕业设计 土木工程毕业设计 视觉传达毕业设计 理工论文 文科论文 毕设资料 帮助中心 设计流程 
垫片
您现在所在的位置:首页 >>毕设资料 >> 文章内容
                 
垫片
   我们提供全套毕业设计和毕业论文服务,联系微信号:biyezuopinvvp QQ:1015083682   
基于CUDA的高精度多序列比对算法实现与优化及双序列比对加速的效率与准确性研究 开题报告
文章来源:www.biyezuopin.vip   发布者:毕业作品网站  

毕业论文开题报告

论文题目  基于CUDA的多序列比对并行算法的设计

          与实现

院    系          电子与信息工程学院

专    业           计算机科学与技术


1.本课题研究的背景、目的及意义

1.1 研究背景

(1) 蛋白质序列研究

蛋白质作为生命现象的物质基础之一,是构成一切细胞组织结构的重要组成成分,参与了生物体内许多方面的重要生命过程,是生命活动的重要承担者。虽然说脱氧核糖核酸(DNA)是遗传信息的载体,但是遗传信息的复制、转录和表达都需要依靠各种蛋白质之间的协作才能完成。蛋白质组学较之于基因组学,对于生命现象的解释更直接、更准确,近年得到了快速发展,并受到世界各国学者的高度关注。在后基因组时代,随着蛋白质测序技术的飞速发展,蛋白质序列的数据呈爆炸性增长,目前在著名的蛋白质数据库uniprotkb中,已经存有超过120,243,849条蛋白质的一级序列信息(截止到2018-07-16),并继续保持快速增长的趋势。然而,对于构成基因家族的成组的序列来说,我们要建立多个序列之间的关系,这样才能揭示整个基因家族的特征。多序列比对在阐明一组相关序列的重要生物学模式方面起着相当重要的作用。

(2)序列比对算法

所谓的序列比对,就是两个或者多个序列按照碱基排列进行比较,从而反映片段之间的相似性和阐明序列的同源性。这里主要是将未知功能的序列与已知序列进行比对,从而确定序列分析。序列比对的基本思想是,基于生物学中序列决定结构,结构决定功能的普遍规律,将核酸序列和蛋白质一级结构上的序列都看成由基本字符组成的字符串,检测序列之间的相似性,发现生物序列中的功能、结构和进化的信息。序列比对也可分为双序列比对和多序列比对,多序列比对是双序列比对的扩展,难度也更大。序列比对是生物信息学中最基本的运算 , Needleman 等最早将动态规划方法引入到生物序 列比对中, 提出了 Needleman-Wunsch 算法[1],实现序 列的全局比对.Smith 等改进了 Needleman-Wunsch 算法 ,提出了著名的 Smith-Waterman(SW)算法[2], 实现序列的局部比对.虽然 SW 算法能良好地表示 2 个比对序列的相似性 ,但计算速度非常慢,其时间复杂度为 О(mn),其中 m , n 分别表示进行比对的 2 条序列字符串的长度.为了降低 SW 算法的复杂性, Altschul[3] 等和 Rearson[4] 等提出了一系列启发式算法,这些算法虽然在速度上有很大改进 ,然而却是以牺牲比对结果的质量为代价.

(3)CUDA平台

随着越来越多的基因组序列被测定,生物序列变得越来越庞大,对比对算法性能的提高、效率的改善提出了更高的要求。与此同时,多核 众核体系架构的引入使得计算 机的计算能力成倍增长 .GPU 的并行处理能力越来越强大,而且不再拘泥于传统的图形处理,开始辅助CPU 完成图形计算以外的运算.如果能充分利用 GPU 的并行处理能力,与单纯的 CPU 计算相比, 计算性能可得到很大的提升(如下图1.1与图1.2)。

图1.1:GPU和CPU每秒浮点操作数

图1.2:GPU与CPU存储器带宽

CUDA(Compute Unified Device Architecture)[5],是显卡厂商NVIDIA推出的运算平台。CUDA是一种由NVIDIA推出的通用并行计算架构,该架构使GPU能够解决复杂的计算问题。它包含了CUDA指令集架构(ISA)以及GPU内部的并行计算引擎。开发人员可以使用C语言来为CUDA架构编写程序,C语言是应用最广泛的一种高级编程语言。所编写出的程序可以在支持CUDA的处理器上以超高性能运行。CUDA3.0已经开始支持C++和FORTRAN,如图1.3。

图1.3:CUDA设计为支持多种语言和应用编程接口

1.2 研究目的及意义

多序列比对有时用来区分一组序列之间的差异,但其主要用于描述一组序列之间的相似性关系,以便对一个基因家族的特征有一个简明扼要的了解。多序列比对的目标是使得参与比对的序列中有尽可能多的列具有相同的字符,即,使得相同残基的位点位于同一列,这样以便于发现不同的序列之间的相似部分,从而推断它们在结构和功能上的相似关系。通过对生物核酸序列的分析,人们希望找到基因和基因调控序列,揭示生物的遗传和进化规律。此外,通过基因比对还可以进一步预测蛋白质的结构和功能,如预测蛋白质的二级结构和三级结构、估计蛋白质折叠类型的总数,基因组序列分析等。而蛋白质是生命存在的物质基础,在细胞生命活动的各个方面发挥着各种各样的作用,如决定生物的结构和性状、参与基因的表达和调控,负责生物化学的催化等等,对现代生物研究具有重大的意义。

2.本课题主要研究内容和预期目标

2.1 研究内容

本课题主要研究基于CUDA平台的多序列并行比对算法。研究内容包括:

(1)对经典序列比对算法的理论学习;

(2)CUDA平台学习与掌握;

(3) 测试CPU环境下经典算法的速度与正确率;

(4)利用CUDA平台加速经典序列比对算法;

2.2 预期目标

(1)理解并掌握经典序列比对算法的实现原理

(2)掌握CUDA平台基本操作与使用

(3)在毕业设计过程中,翻译一份与课题相关的5000字以上的英文资料。

(4)在毕业设计后期,提交10000字以上的毕业设计论文一份。论文要求内容完整,格式符合规范,语言通顺,逻辑清晰。

3.本课题拟采用的研究方法、步骤

3.1 研究方法

(1)对于序列比对算法的研究,采用文献调查法,查阅文献掌握算法原理。

(2)对CUDA的加速成果,采用比较研究法。

3.2 研究步骤

(1)查阅资料,理解经典序列比对算法实现原理

(2)使用CPU环境,测试经典序列比对算法运行时间

(3)在CUDA平台下,实现经典序列比对算法

(4)观察运行结果,得出结论

4.本课题主要参考文献

[1] Needleman S B ,Wunsch C D .A general method applicable t o the search f or similarities in the amino acid sequence of two protein s[J] .Journal of Molecular Biology,1970,48(3): 443-453

[2] Smith T F , Waterman M S .Identification of comm on molecular sub sequences [J] .Journal of Molecular Biology,1981,147(1):195-197 [3]

[3] Altschul S F , Madden T L, Schäff er A A , et al. Gapped BLAST and PSI-BLAST : a new generation of protein database search programs [J] .Journal of Nucleic Acid s Research,1997,25(17):3389-3402

[4] Pearson W R, Lipman D J .Imp roved tools f or biological sequence comparison [J].Journal of National Academy of Sciences,1988,85(8):2444-2448

[5] [美]托尔加·索亚塔(Tolga Soyata).基于CUDA的GPU并行程序开发指南[M].机械工业出版社,2019.7

其中:

参考书(M)

论文(J)、(D)

网络资源(EB/OL)

5.本课题的具体进度安排(包括序号、起迄日期、工作内容)

(1)2021.1.5 ---- 2021. 2.28   查阅资料, 撰写开题报告

(2)2021.3.1 ---- 2021.3.15 需求分析,熟悉开发工具

(3)2021.3.15 ---- 2021.3.20 概要设计

(4)2021.3.21 ---- 2021.4.1   详细设计

(5)2021.4.2 ---- 2021.5.1    编写代码及设计,程序调试

(6)2021.5.2 ---- 2021.5.5 毕业论文资料收集,撰写论文提纲

(7)2021.5.6 ---- 2021.5.31 整理设计文档, 撰写毕业论文

(9)2021.6.1---- 2021.6.9    论文修改、系统改进、答辩准备及答辩

指导教师意见:

指导教师: (亲笔签名)

年   月   日

注:表格的大小可视内容的多少可自行调整。

  全套毕业设计论文现成成品资料请咨询微信号:biyezuopinvvp QQ:1015083682     返回首页 如转载请注明来源于www.biyezuopin.vip  

                 

打印本页 | 关闭窗口
本类最新文章
基于CUDA的高精度多序列比对算 基于CUDA的高精度多序列比对算 基于Vue+SpringBoot
基于Vue+SpringBoot 基于Vue+SpringBoot 基于SpringBoot框架的人
| 关于我们 | 友情链接 | 毕业设计招聘 |

Email:biyeshejiba@163.com 微信号:biyezuopinvvp QQ:1015083682  
本站毕业设计毕业论文资料均属原创者所有,仅供学习交流之用,请勿转载并做其他非法用途.如有侵犯您的版权有损您的利益,请联系我们会立即改正或删除有关内容!