2024年度 学院等開講科目 情報理工学院 情報工学系 情報工学コース
クラウドコンピューティングと並列処理
- 開講元
- 情報工学コース
- 担当教員
- 宮﨑 純
- 授業形態
- 講義 (ハイフレックス型)
- メディア利用科目
- -
- 曜日・時限
(講義室) - 月7-8 (W3-301(W331)) / 木7-8 (W3-301(W331))
- クラス
- -
- 科目コード
- CSC.T521
- 単位数
- 200
- 開講時期
- 2024年度
- 開講クォーター
- 1Q
- シラバス更新日
- 2025年3月14日
- 使用言語
- 英語
シラバス
授業の目的(ねらい)、概要
近年の爆発的なデータの増加により、多くの分野から膨大なデータを高速に処理するための計算方法が要求されています。情報工学分野では、この問題の解決に挑戦すべく、高性能ハードウェアを用いた最新のコンピュータシステムを有効に利用するための新しい計算モデルや高速なアルゴリズム、生産性の高いソフトウェア設計手法等が開発されてきています。
本講義では、これらの最新技術を習得します。具体的な講義項目は、クラウド基盤のストレージや並列処理のモデル、MapReduceフレームワーク、ならびに最新プロセッサのための高性能な並行データアクセス手法であるロックフリーアルゴリズムやトランザクショナルメモリ等です。
到達目標
本講義の履修により、以下の習得します。
・高性能ハードウェアを利用した最新のコンピュータシステムの構成の理解
・高性能コンピュータシステムを利活用するための新しい並列処理の計算モデルやアルゴリズムの概念
・クラウド基盤のデータストアの特性やMapReduceモデルに代表される抽象度の高い並列処理技術
・マルチコアプロセッサなど最新プロセッサ上での高性能な計算や並行データアクセスのためのアルゴリズム
・新しい計算モデルやアルゴリズムの大規模データ処理や高性能計算が要求される多くの分野への応用
キーワード
クラウドコンピューティング、クラウドストレージ、MapReduceフレームワーク、キャッシュ指向アルゴリズム、並行データアクセス、ロックフリーアルゴリズム、トランザクショナルメモリ
学生が身につける力
- 専門力
- 教養力
- コミュニケーション力
- 展開力 (探究力又は設定力)
- 展開力 (実践力又は解決力)
授業の進め方
課題欄に記載されている項目ならびその関連事項を各自で調べて、十分に復習しておくことが必要です。
授業計画・課題
授業計画 | 課題 | |
---|---|---|
第1回 | クラウドコンピューティングによる大規模データ処理 | 現在のクラウドサービスの現状を理解する |
第2回 | キーバリューストアのデータモデルと一貫性モデル | キーバリューストアの特性を理解する |
第3回 | クラウドストレージのデータ分散と高可用性 | クラウドストレージのデータ分散方式と高可用性を理解する |
第4回 | クラウドストレージの構成 | クラウドストレージで使用される分散アルゴリズムとその目的を理解する |
第5回 | MapReduceフレームワークと計算モデル | MapReduceフレームワークの各フェーズの役割と制約を理解する |
第6回 | MapReduceを利用した大規模テキスト処理アルゴリズム | MapReduceフレームワークによる転置インデクス構築アルゴリズムを理解する |
第7回 | MapReduceを利用した大規模グラフ処理アルゴリズム | MapReduceフレームワークによるPageRankの計算方法理解する |
第8回 | メインメモリを利用した大規模分散計算 | メインメモリを利用した大規模データの計算方法を理解する |
第9回 | メモリ階層を意識したデータ指向高性能計算 | データアクセスとキャッシュメモリへの影響との関係を理解する |
第10回 | キャッシュ指向探索アルゴリズム | キャッシュ指向の探索アルゴリズムとキャッシュメモリとの関係を理解する |
第11回 | 並行実行スレッドと同期 | ロックを利用した基本的な並行データアクセス方法を理解する |
第12回 | 並行実行スレッドのフォーマルモデル | Linearizabilityの定義を理解する |
第13回 | 並行データアクセス: ロックフリーアルゴリズム | ロックを利用しない並行データアクセス方法を理解する |
第14回 | 並行データアクセス: トランザクショナルメモリ | ソフトウェアトランザクショナルメモリの原理を理解する |
準備学修(事前学修・復習)等についての指示
学修効果を上げるため,教科書や配布資料等の該当箇所を参照し,「毎授業」授業内容に関する予習と復習(課題含む)をそれぞれ概ね100分を目安に行うこと。
教科書
指定なし。講義資料はT2SCHOLAで配布する。
参考書、講義資料等
[参考文献]
J. Lin, C. Dyer, "Data-Intensive Text Processing with MapReduce", Morgan & Claypool Publisher
T. Harris, J. Larus, R. Rajwar, "Transactional Memory", 2nd edition, Morgan & Claypool Publisher
成績評価の方法及び基準
クラウドコンピューティングの原理とその並列処理方式、メモリ階層とアルゴリズムの関係、ならびに並行データアクセスに関する理解度を評価する。小課題(20%)、中間課題(40%)と期末課題(40%)により評価する。
関連する科目
- CSC.T433 : 先端コンピュータアーキテクチャ
- CSC.T523 : 先端データ工学
- CSC.T425 : 並行システム論
- CSC.T438 : 分散アルゴリズム
履修の条件・注意事項
以下の予備知識があることが望ましい。
- 分散アルゴリズム
- データベース
- 並行プログラミング
- コンピュータアーキテクチャ