Hadoop入門に最適なチュートリアルサイトまとめ・比較7つ

入門

ペタバイトなどの超大容量とも言えるデータを高速で処理することができる、「Hadoop」は、世界的に注目されています。今回は、Hadoopを今から学びたい!という方、若しくはHadoopについて復習したり技術を向上させたりしたい!という方におすすめの入門チュートリアルをご紹介していきます。

更新日時:

views1783

こんにちは、サトゥです!近年、ビッグデータが活用されるようになったこともあり、大容量のデータを処理できるソフトウェア基盤の需要が上がってきました。特に、ペタバイトなどの超大容量とも言えるデータを高速で処理することができる、「Hadoop」は、世界的に注目されています。 今回は、そんなHadoopを今から学びたい!という方、若しくはHadoopについて復習したり技術を向上させたりしたい!という方におすすめの入門チュートリアルをご紹介していきます。 現代社会では、データが日々増え続けているので、今後はデータ処理の重要性も、更に上がっていくと考えられます。来る将来に備えて、今からでもHadoopを学習しておきたいという方、必見ですよ!

Hadoop入門チュートリアルサイトまとめ

それでは、Hadoopの入門におすすめのチュートリアルサイトをご紹介していきますね。 今回は、「初心者」「中級者」「上級者」の、3つの難易度に分けてご紹介していきます。ご自身のレベルに合った段階から初めて、確実にHadoopを習得しましょう。

【初心者】OpenGroove Be Futuristic. Hadoop – 初めの一歩

・対象:初心者 ・時間:1日 ・スタート:Hadoopとは何か? ・ゴール:Hadoopの基本的なシステムの理解 Hadoopがどのようなものかを知るのにうってつけのサイトです。Hadoopの概念や基本的な機能・システムなどについて、図解と詳しい解説がぎっしり掲載されています。ゼロからスタートする方は、このページに目を通してからHadoopの学習を始めることをおすすめします。

【初心者】@IT テキストマイニングで始める実践Hadoop活用

・対象:初心者 ・時間:1週間 ・スタート:Hadoopとは? ・ゴール:Hadoopを使って実際にテキストマイニングを行う Hadoopの概念から学べる、初心者向けのチュートリアルサイト。全3回の講座で、基礎知識から実践まで学習することができます。実践的な内容のページには、サンプルコードなどがたくさん掲載されています。解説やサンプルコードにじっくりと目を通せば、初心者でもHadoopを使ってテキストマイニングができるので、とにかく手を動かしてHadoopを学びたい!という方におすすめです。

【初級~中級者】Qiita Hadoop導入とPythonによるMapReduce

・対象者:初級~中級者 ・時間:1~3日 ・スタート:Java以外の言語でHadoopを始めるには? ・ゴール:Hadoopのインストール、環境構築 JavaではなくPythonを使ってHadoopを活用したいという方を対象にした、基本操作のチュートリアル。その為、JavaでHadoopを使おうと考えている方向けではありません。サンプルコードや専門用語が多いので、ゼロから始めるという方には、難易度の高い内容となっています。しかし、Hadoopのインストールや環境構築の方法が詳しく説明されているので、Hadoopの基本知識を学び、これから実践へとステップアップをする初心者~中級者の方にはぴったりの内容でしょう。

【中級者】Qiita hadoop少しだけ触ってみた(mac1台構成)

・対象者:中級者 ・時間:1日~3日 ・スタート:Hadoopのインストール ・ゴール:Hadoopのサンプルプログラムの実行 Macを使ったHadoopのインストール方法から、サンプルプログラムや基本動作の実行までをカバーしたチュートリアル。解説よりも、サンプルコードが多めです。内容としては初心者向けですが、サンプルコードを参考に手順や操作を学んでいくタイプなので、まったくの初心者という方には、難易度が高いと思います。Hadoopに関するある程度の知識がある方ならば、さくさく進められるでしょう。

【中級~上級者】Yahoo!Japanデベロッパーネットワーク Hadoopを使いこなす(1)

・対象者:中級者~上級者 ・時間:3日 ・スタート:MapReduceとは何か? ・ゴール:Hadoopのカスタマイズ Hadoopの基本知識があることを前提としている、中・上級者向けのチュートリアルサイトです。Hadoopのカスタマイズをするのに必要な考え方や方法、手順がサンプルコードと共に掲載されています。実践経験を積みながら、Hadoopの機能や特性をより深く理解したいという方におすすめですよ。今回、(1)をご紹介しましたが、(2)(3)に関しては、(1)のページ内にリンクが設置されているので、(1)の内容をクリアしたら、ぜひそちらにも挑戦してみて下さいね。

【上級者】Hadoopチュートリアル WordCount

・対象者:上級者 ・時間:1~3日 ・スタート:Eclipseの設定 ・ゴール:Eclipseからデバッグ実行 Hadoop公式サイトに掲載されているチュートリアルのWordCountを、単独で動かすことをコンセプトにしたチュートリアルサイトです。チュートリアルのコンパイル方法から、内容のフォローまで、サンプルコードを掲載して説明しています。専門用語などが使用されている解説もあるので、Hadoopに関するある程度の知識を持っている方向けのチュートリアルだと言えるでしょう。

【上級者】Hadoop チュートリアル: Windows 上の HDInsight で Hadoop を使用する

・対象者:上級者 ・時間:2週間 ・スタート:Windows 上の HDInsight で Hadoop を使えるようにするには? ・ゴール:非構造化データをHadoop クラスターでクエリ実行、クエリ実行した結果の分析 非構造化データに対して、Hiveクエリを実行し、情報を抽出することを目的とした Hadoop チュートリアルです。 Hadoopの基礎知識はもちろん、 Hadoopの基本操作なども一通り分からないと、進めていくことが難しいかもしれません。実行画面の画像が手順に沿って掲載されているので、Hadoop に関するある程度の知識や使用経験がある方ならば、指示や説明に沿ってじっくり目を通せば、進めていくことができるでしょう。Hadoop の技術を向上させたい上級者におすすめです。

コツは複数のチュートリアルを活用すること!

今回は、 Hadoop のチュートリアルサイトを難易度別にご紹介しましたが、いかがでしたでしょうか? Hadoopを完全に習得するコツは、1つのサイトだけで終わらずに、複数のチュートリアルに挑戦してみることです。例えば、同じ事柄についてでも、サイトやチュートリアルによって、解説や解釈が異なることがあります。いくつかのチュートリアルを併用することで、Hadoop に対する知識がより高まり、入門卒業への近道となるでしょう。 また、チュートリアルを1つでも終えられた方は、参考書での勉強もオススメします。 翔泳社から出ている「Hadoop徹底入門 第2版 オープンソース分散処理環境の構築」は、 システムの拡張や監視、メンテナンス方法など、より現場での利用を意識した最新のノウハウをまとまっているため、さらなるスキルアップをのぞめますよ。 ぜひ、チュートリアルや参考書を使ってHadoopに挑戦してみて下さいね。

関連タグ

アクセスランキング

《最大6つの質問で診断完了!》
Facebook Messenger
経由で
あなたにマッチした転職を診断します。

今スグ診断(無料)

《最大6つの質問で診断完了!》
Facebook Messenger
経由で
あなたにマッチした転職を診断します。

今スグ診断(無料)