2025年度 (最新) 学院等開講科目 情報理工学院 情報工学系
生命情報解析
- 開講元
- 情報工学系
- 担当教員
- 秋山 泰 / 山村 雅幸 / 瀧ノ上 正浩
- 授業形態
- 講義 (対面型)
- メディア利用科目
- -
- 曜日・時限
(講義室) - 火7-8 (W3-301(W331)) / 金7-8 (W3-301(W331))
- クラス
- -
- 科目コード
- CSC.T353
- 単位数
- 200
- 開講時期
- 2025年度
- 開講クォーター
- 2Q
- シラバス更新日
- 2025年4月2日
- 使用言語
- 日本語
シラバス
授業の目的(ねらい)、概要
本講義では、爆発的に増加しつつある遺伝子配列やタンパク質構造などの生命情報について、コンピュータ上でデータとして表現・交換するための様々な手法と、そのデータを用いた比較解析、知識抽出などのアルゴリズムの基礎的な例を取り扱う。秋山によるパート(火曜日)では、動的計画法に基づく2本の配列間の最適アラインメントの問題からスタートし、データベースに対する大量検索の場合に用いる高速化手法などを説明する。また多くの配列間の関係を同時に考慮する多重アラインメントや系統樹推定では、厳密解法では本数の増加に対して指数関数的な計算量が必要となることから各種の近似解法が重要であることを説明する。山村・瀧ノ上によるパート(金曜日)では、生物の細胞システム内のさまざまな挙動をシステム的に捉える見方を紹介し、アナログおよびデジタルシミュレーションの基本的な諸手法を紹介する。また、分子を使ったコンピュータ(分子コンピュータ)の設計のための非線形方程式のシミュレーションと解析についても触れる。本講義では、生物学や生化学の事前知識は一切仮定せず、これらについて最小限の入門的な知識を与えた上で、アルゴリズム、計算量、非線形システム解析、数値シミュレーションといった情報工学的な観点から考察する。
生命科学の急速な発展にともない、生物学・医学・薬学等の分野では、多種類で不均質なデータが大量に得られつつある。生命情報のコンピュータ解析は21世紀の人々の暮らしの向上にきわめて重要であり、情報工学者としても基盤的な理解は身に付けて欲しい。ここで学ぶ手法は、生命情報のみならず実世界の多様なデータの解析と知識抽出に対して適用可能であるため、情報工学で学ぶ手法が実世界にどう応用されるのか、例示を通じて理解を進める効果を狙っている。
到達目標
本講義を履修することによって次の能力を修得する。
1)配列データを表現する各種のモデル(正規表現,プロファイル行列,隠れマルコフモデル)を説明できる
2)動的計画法のアルゴリズムを説明でき,それが用いられる複数の実応用を説明できる
3)多重アラインメントや進化系統樹推定では近似解法が重要であることを計算量の観点から説明できる
4)配列データベースに対する相同性検索におけるE値とP値の意味を説明でき,値を求めることができる
5)大規模なデータベースに対する相同性検索の高速化手法について説明できる
6)分子コンピューティングや細胞内反応をシステム的に捉えるため、微分方程式等を使ったアナログシミュレーション、およびデジタルシミュレーションの基本的手法について説明できる
キーワード
生命情報,配列解析, 動的計画法,隠れマルコフモデル,アナログ・シミュレーション, デジタル・シミュレーション
学生が身につける力
- 専門力
- 教養力
- コミュニケーション力
- 展開力 (探究力又は設定力)
- 展開力 (実践力又は解決力)
授業の進め方
座学による講義を通じて,各回の内容を解説します。講義の後半で,その日の内容に関する演習問題を解いてもらいます。
授業計画・課題
授業計画 | 課題 | |
---|---|---|
第1回 | 配列アラインメント(秋山) -経路探索問題,動的計画法,大域的配列アラインメント, 局所的配列アラインメント | 動的計画法による大域的および局所的配列アラインメントの計算 |
第2回 | 分子コンピューティング・生命システムのシミュレーションのための基礎知識(山村・瀧ノ上) | 分子生物学・数理生物学の基本の紹介 |
第3回 | 多重配列アラインメント(秋山) -多重アラインメントの計算量,ヒューリスティックな手法 | スター法やツリーベース法による多重配列アラインメントの計算 |
第4回 | 生命システムのアナログ・シミュレーション (1)(山村・瀧ノ上) | 非線形微分方程式・MATLAB |
第5回 | 進化系統樹推定(秋山) -距離行列法,形質状態法,系統樹の確からしさ | UPGMA法やNJ法による進化系統樹の計算 |
第6回 | 生命システムのアナログ・シミュレーション (2)(山村・瀧ノ上) | 非線形微分方程式と非線形システム解析 |
第7回 | データベースからの相同性検索(秋山) -アミノ酸置換行列,ヒットの有意性,e値,ビットスコア,p値 | データベース検索におけるヒットのe値およびp値の計算 |
第8回 | 生命システムのアナログ・シミュレーション (3)(山村・瀧ノ上) | 代表的な非線形システム |
第9回 | 相同性検索の高速化(秋山) -FASTA,BLAST,and PSI-BLAST | 探索表による部分文字列の高速検索 |
第10回 | 生命システムのデジタル・シミュレーション (1)(山村・瀧ノ上) | 確率シミュレーション1 |
第11回 | モチーフの表現と抽出(秋山) -正規表現,プロファイル行列,隠れマルコフモデル | モチーフ配列の各種モデルによる表現法の理解 |
第12回 | 生命システムのデジタル・シミュレーション (2)(山村・瀧ノ上) | 確率シミュレーション2 |
第13回 | タンパク質の構造解析(秋山) -二次構造,三次構造,分子シミュレーション | タンパク質の二次構造・三次構造および解析手法に関する理解 |
第14回 | 生命システムのシミュレーションに関する発展的話題(山村・瀧ノ上) | 代表的な生命シミュレーション(遺伝子ネットワーク、分子コンピューティング) |
準備学修(事前学修・復習)等についての指示
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
教科書
独自配布のスライド資料を用いる
参考書、講義資料等
バイオインフォマティクス学会編 『バイオインフォマティクス入門』 慶應義塾大学出版会, ISBN:978-4-7664-2251-1
成績評価の方法及び基準
生命情報解析における各種データ表現法,アルゴリズム,応用等に関して,その理解度を評価
配点は,期末試験(100%)
関連する科目
- CSC.T362 : 数値計算法
履修の条件・注意事項
特になし