ビッグデータのトレーニングコース

ビッグデータのトレーニングコース

ローカルのインストラクターによるライブビッグデータトレーニングコースは、ビッグデータの基本概念の紹介から始め、次にデータ分析を実行するために使用されるプログラミング言語と方法論に進みます。ビッグデータストレージ、分散処理、およびスケーラビリティを実現するためのツールとインフラストラクチャについては、デモ練習セッションで説明し、比較し、実装します。ビッグデータトレーニングは、「オンサイトライブトレーニング」または「リモートライブトレーニング」として利用できます。現場での現場でのトレーニングは、 日本 NobleProgの企業研修センターで日本 。リモートライブトレーニングは、インタラクティブなリモートデスクトップを介して実行されます。 NobleProg - あなたの地域のトレーニングプロバイダー

お客様の声

★★★★★
★★★★★

ビッグデータコース概要

CodeNameDurationOverview
smtwebintSemantic Web Overview7 hoursセマンティックWebは、ワールドワイドウェブ上のデータの一般的なフォーマットを促進するワールドワイドウェブコンソーシアム(W3C)が主導する共同運動です。セマンティックWebは、アプリケーション、エンタープライズ、コミュニティの境界でデータを共有して再利用できる共通のフレームワークを提供します。
ApacheIgniteApache Ignite: Improve Speed, Scale and Availability with In-Memory Computing14 hoursApache 発火は、速度、規模、および可用性を向上させるためにアプリケーションとデータ層の間に位置するメモリ内コンピューティングプラットフォームです。

このインストラクター主導のライブトレーニングでは、サンプルインメモリコンピューティングプロジェクトの作成をステップ実行する際に、永続的で純粋なインメモリストレージの原則を受講者が学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、メモリ内の、ディスク上の永続性だけでなく、純粋に分散されたインメモリデータベースに対して発火を使用します。
- は、データをリレーショナルデータベースに同期させることなく永続性を実現します。
- は、SQL と分散結合を実行するために発火を使用します。
- は、ストレージとして RAM を使用して、CPU に近いデータを移動することにより、パフォーマンスを向上させます。
- は、水平方向のスケーラビリティを実現するために、クラスタ全体にデータセットを分散します。
- は RDBMS、NoSQL、Hadoop および機械学習プロセッサと発火を統合します。

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
graphcomputingIntroduction to Graph Computing28 hours多くの現実世界の問題は、グラフの面で記述することができます。たとえば、Web グラフ、ソーシャルネットワークグラフ、列車ネットワークグラフ、言語グラフなどがあります。これらのグラフは非常に大きくなる傾向があります。それらを処理するには、特殊なツールとプロセスのセットが必要です--これらのツールとプロセスは、グラフ・コンピューティング (グラフ分析とも呼ばれます) と呼ばれることができます。

このインストラクター主導のライブトレーニングでは、グラフデータを処理するためのテクノロジの提供と実装方法について説明します。目的は、現実世界のオブジェクト、その特性と関係を識別し、これらの関係をモデル化し、グラフコンピューティングのアプローチを使用してデータとして処理することです。一連のケーススタディ、実践的な演習、およびライブ展開をステップ実行しながら、特定のツールについて大まかな概要と絞り込みを開始します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- グラフデータの永続化と走査
- 特定のタスクに最適なフレームワークを選択する方法を理解する (グラフデータベースからバッチ処理フレームワークへ)
- は、Hadoop、Spark、GraphX、Pregel を実装して、多数のグラフコンピューティングを実行します。並列のマシン
- は、グラフの面で現実世界のビッグデータの問題を表示する, プロセスと走査

聴衆

- の開発者

の の形式コース

- の部分の講義,パートディスカッション、演習と重い実践的な実践
matlabpredanalyticsMatlab for Predictive Analytics21 hours予測分析は、データ分析を使用して将来に関する予測を行うプロセスです。このプロセスでは、データマイニング、統計、および機械学習の手法と共にデータを使用して、将来のイベントを予測するための予測モデルを作成します。

このインストラクター主導のライブトレーニングでは、Matlab を使用して予測モデルを作成し、それらを大規模なサンプルデータセットに適用して、データに基づいて将来のイベントを予測する方法について説明します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- 予測モデルを作成して、履歴データとトランザクション
のパターンを分析します。 - 予測モデリングを使用してリスクとオポチュニティを特定する
- は重要な傾向を取り込む数学的モデルを構築する
- は、デバイスやビジネスシステムのデータを使用して、廃棄物の削減、時間の節約、コスト削減を

観客

- 開発者
- エンジニア
- ドメインの専門家
コース の

形式

- 部講義、パート討論、演習と重い実地練習
nifidevApache NiFi for Developers7 hoursApache NiFi (Hortonworks データフロー) は、リアルタイムで統合されたデータロジスティクスと単純なイベント処理プラットフォームであり、システム間の移動、追跡、および自動化を可能にします。フローベースのプログラミングを使用して記述され、リアルタイムでデータフローを管理するための web ベースのユーザーインターフェイスを提供します。

このインストラクター主導のライブトレーニングでは、Apache NiFi を使用してデモの拡張機能、コンポーネント、およびプロセッサの数を開発する際に、フローベースのプログラミングの基礎を学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、NiFi & #39 のアーキテクチャとデータフローの概念を理解して
- NiFi およびサードパーティの api を使用して拡張機能を開発する
独自の Apache Nifi プロセッサを開発 - カスタム
- は、異種および珍しいファイル形式やデータソースからリアルタイムのデータを取り込み、処理します

観客

- 開発者
- データエンジニア
コース の

形式

- 部講義、パート討論、演習と重い実地練習
nifiApache NiFi for Administrators21 hoursApache NiFi (Hortonworks データフロー) は、リアルタイムで統合されたデータロジスティクスと単純なイベント処理プラットフォームであり、システム間の移動、追跡、および自動化を可能にします。フローベースのプログラミングを使用して記述され、リアルタイムでデータフローを管理するための web ベースのユーザーインターフェイスを提供します。

このインストラクター主導のライブトレーニングでは、live lab 環境で Apache NiFi を展開および管理する方法を受講者が学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Apachi NiFi
のインストールと設定 - ソース、変換、およびデータベースとビッグデータ湖
を含む異種、分散データソースからデータを管理する - 自動化データフロー
- ストリーミング分析を有効にする
- データの取り込みにさまざまなアプローチを適用する
- ビッグデータを変換し、ビジネス洞察力に

観客

- システム管理者
- データエンジニア
- 開発者
- DevOps
コース の

形式

- 部講義、パート討論、演習と重い実地練習
solrcloudSolrCloud14 hoursApache SolrCloud は分散型ネットワーク上のファイルの検索とインデックス作成を容易にする分散データ処理エンジンです。

このインストラクター主導のライブトレーニングでは、参加者は Amazon AWS で SolrCloud インスタンスを設定する方法を学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、SolCloud & #39 の特徴と、それらが従来のマスタスレーブクラスタとどのように比較されるかを理解して
- SolCloud 集中クラスタを構成する
- は、シャードとの通信、シャードへのドキュメントの追加などのプロセスを自動化します
- は、SolrCloud と連携して飼育係を使用して、プロセスをさらに自動化し
- インターフェイスを使用してエラー報告を管理する
- 負荷分散 SolrCloud インストール
- 連続処理およびフェイルオーバー
のための SolrCloud の構成

観客

- Solr 開発者
- プロジェクトマネージャー
- システム管理者
- 検索アナリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
datavaultData Vault: Building a Scalable Data Warehouse28 hoursデータボールトのモデリングは、複数のソースから発生するデータの長期的な履歴保存を提供するデータベースのモデリング手法です。データボールトは、ファクトの1つのバージョン、またはすべてのデータを "、すべての時間" を格納します。その柔軟性、拡張性、一貫性、適応性に優れたデザインは、第3正規形 (3NF) とスタースキーマの最高の側面を網羅しています。

このインストラクター主導の、ライブトレーニングでは、参加者はどのようにデータボールトを構築する方法を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、データボールト2.0 の背後にあるアーキテクチャと設計の概念、およびビッグデータ、NoSQL と AI との相互作用を理解しています。
- では、データ保管技術を使用して、データウェアハウスの履歴データの監査、トレース、および検査を有効に
- は一貫性のある再現性のある ETL (抽出、変換、ロード) プロセスを開発し
- は、拡張性と再現性に優れた倉庫を構築および展開します

観客

- データモデラー
- データウェアハウススペシャリスト
- ビジネスインテリジェンススペシャリスト
- データエンジニア
- データベース管理者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
datameerDatameer for Data Analysts14 hoursDatameer は、Hadoop 上に構築されたビジネスインテリジェンスおよびアナリティクスプラットフォームです。これにより、エンドユーザーは、使いやすい方法で、大規模な構造化された半構造化データと非構造化情報にアクセスし、探索し、関連づけることができます。

このインストラクター主導のライブトレーニングでは、Datameer を使用して Hadoop & #39 を克服する方法について学習し、一連のビッグデータソースのセットアップと分析を段階的に実行します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- エンタープライズデータを作成、バーテン、対話的に探索する
湖 - アクセスビジネスインテリジェンスデータウェアハウス、トランザクションデータベース、およびその他の分析ストア
- エンドツーエンドのデータ処理パイプラインを設計するには、スプレッドシートのユーザーインターフェイスを使用します
- アクセス事前に構築された関数は、複雑なデータの関係を探るために
- ドラッグアンドドロップウィザードを使用してデータを視覚化し、ダッシュボードを作成する
- テーブル、グラフ、グラフ、およびマップを使用してクエリ結果を分析する

観客

- データアナリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
tigonTigon: Real-time Streaming for the Real World14 hoursタイゴンは、オープンソース、リアルタイム、低レイテンシ、高スループット、ネイティブヤーン、持続性のために HDFS と HBase の上に位置するストリーム処理フレームワークです。タイゴンアプリケーションは、ネットワーク侵入検知と分析、ソーシャルメディア市場分析、ロケーション分析、ユーザーへのリアルタイムの推奨などのユースケースに対応しています。

は、このインストラクター主導のライブトレーニングでは、サンプルアプリケーションの作成を通じて参加者をウォークする際に、リアルタイムおよびバッチ処理をブレンドするタイゴン & #39 のアプローチを紹介します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、大量のデータを処理するための強力なストリーム処理アプリケーションを作成し
- は、Twitter やウェブサーバのログなどのプロセスストリームのソースを
- は、ストリームの迅速な結合、フィルタリング、および集約のためにタイゴンを使用し

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
vespaVespa: Serving Large-Scale Data in Real-Time14 hoursベスパは、オープンソースのビッグデータ処理とエンジンを提供するヤフーによって作成されます。 ユーザーのクエリに応答し、推奨事項を作成し、パーソナライズされたコンテンツと広告をリアルタイムで提供するために使用します。

は、このインストラクター主導のライブトレーニングでは、大規模なデータを提供するという課題を紹介し、ユーザーの要求への応答を計算できるアプリケーションを作成することにより、参加者をリアルタイムで大量に処理します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- を使用してベスパはすぐにデータを計算する (ストア, 検索, ランク, 整理) ユーザーが待機している間に時間を提供する
- は、機能検索、推奨事項、およびパーソナライゼーション
を含む既存のアプリケーションにベスパを実装します。 - は、Hadoop やストームなどの既存のビッグデータシステムとベスパを統合して展開します。

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
bigdatabicriminalBig Data Business Intelligence for Criminal Intelligence Analysis35 hours技術の進歩と情報量の増加は、法執行機関の実施方法を変革しています。ビッグデータがもたらす課題は、ビッグデータと #39 の約束とほぼ同じくらい困難です。データを効率的に格納することは、これらの課題の1つです。それを効果的に分析することは別です。

は、このインストラクター主導の、ライブトレーニングでは、参加者は、ビッグデータ技術にアプローチするための考え方を学び、既存のプロセスや政策への影響を評価し、犯罪者を識別する目的のためにこれらの技術を実装する活動と犯罪を防止する。世界中の法執行機関からのケーススタディは、彼らの採用のアプローチ、課題と結果についての洞察を得るために検討されます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は調査の間に物語をつなぎ合わせるために従来のデータ収集プロセスとビッグデータ技術を結合する
- は、データ解析のための産業用ビッグデータストレージおよび処理ソリューションを実装
- は、犯罪捜査にデータ駆動型のアプローチを有効にするための最も適切なツールとプロセスの採用のための提案を準備する

観客

技術的な背景を持つ - 法執行機関のスペシャリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
apexApache Apex: Processing Big Data-in-Motion21 hoursApache Apex は、ストリームとバッチ処理を統一する糸ネイティブプラットフォームです。拡張性、パフォーマンス、フォールトトレラント、ステートフル、セキュア、分散、および操作が容易な方法で、大規模なデータ・イン・モーションを処理します。

このインストラクター主導の

は、Apache apex & #39 の統合ストリーム処理アーキテクチャを導入し、Hadoop 上の apex を使用した分散アプリケーションの作成を通じて参加者をウォークします。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、ソースやシンク用のコネクタ、一般的なデータ変換などのデータ処理パイプラインの概念について理解しています
- は、Apex アプリケーションの構築、拡張、最適化を
- は、リアルタイムのデータストリームを確実かつ最小レイテンシ
で処理します。 - は、apex コアと apex Malhar ライブラリを使用して、迅速なアプリケーション開発を可能にし
- は、既存の Java コードを書き、再利用するために Apex API を使用します
- は、処理エンジンとして他のアプリケーションに Apex を統合する
- チューン、テスト、スケール Apex アプリケーション

観客

- 開発者
- エンタープライズアーキテクト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
alluxioAlluxio: Unifying Disparate Storage Systems7 hoursAlluxio は、異種ストレージシステムを統合し、アプリケーションがメモリ速度でデータと対話できるようにするオープンソースの仮想分散ストレージシステムです。これは、インテル、Baidu とアリババなどの企業によって使用されます。

このインストラクター主導のライブトレーニングでは、Alluxio を使用してストレージシステムと異なる計算フレームワークを橋渡しし、マルチペタバイト規模のデータを効率的に管理して、アプリケーションの作成をステップ実行する方法を学習します。Alluxio ・

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Alluxio
を使用したアプリケーションの開発 - は、1つの名前空間を維持しながらビッグデータシステムとアプリケーションを接続する
- は、任意のストレージ形式のビッグデータから効率的に値を抽出
- ワークロードパフォーマンスの向上
- Alluxio スタンドアロンまたはクラスタ化された
の展開と管理

観客

- データサイエンティスト
- 開発者
- システム管理者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
flinkFlink for Scalable Stream and Batch Data Processing28 hoursApache Flink は、スケーラブルなストリームおよびバッチデータ処理のためのオープンソースフレームワークです。

は、このインストラクター主導のライブトレーニングは、分散ストリームとバッチデータ処理の背後にある原則とアプローチを紹介し、リアルタイムのデータストリーミングアプリケーションの作成を通じて参加者をウォークします。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- データ解析アプリケーションを開発するための環境を設定する
- は、Flink ベースのフォールトトレラントなデータストリーミングアプリケーションをパッケージ化、実行、および監視し
多様なワークロードの管理 -
- Flink ML
を使用して高度な分析を実行する - マルチノード Flink クラスタのセットアップ
- の測定と最適化のパフォーマンス
- は、異なるビッグデータシステムと Flink を統合する
- は Flink の機能を他のビッグデータ処理フレームワークと比較して

観客

- 開発者
- 建築家
- データエンジニア
- 分析の専門家
- テクニカルマネージャー
コース の

形式

- 部講義、パート討論、演習と重い実地練習
samzaSamza for Stream Processing14 hoursapache Samza は、ストリーム処理のためのオープンソースのほぼリアルタイムの非同期計算フレームワークです。 は、apache カフカをメッセージング用に使用し、フォールトトレランス、プロセッサ分離、セキュリティ、およびリソース管理のための apache Hadoop 糸を使っています。

は、このインストラクター主導のライブトレーニングでは、メッセージングシステムと分散ストリーム処理の原理を紹介しながら、サンプルの Samza ベースのプロジェクトとジョブ実行の作成を通じて参加者を歩きます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、Samza を使用して、メッセージを生成および使用するために必要なコードを簡略化します。
- は、アプリケーションからのメッセージの処理を切り離します。
- は Samza を使用して、ほぼリアルタイムの非同期計算を実装します。
- は、ストリーム処理を使用して、メッセージングシステム上でより高いレベルの抽象化を提供します。

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
zeppelinZeppelin for Interactive Data Analytics14 hoursアパッチ・ツェッペリンは、Hadoop とスパーク・ベースのデータをキャプチャ、探索、視覚化、共有するための web ベースのノートブックです。

は、このインストラクター主導のライブトレーニングは、シングルユーザーまたはマルチユーザー環境でのツェッペリンの展開と使用を通じてインタラクティブなデータ分析とウォーク参加者の背後にある概念を紹介します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- ツェッペリン
のインストールと設定 - は、ブラウザベースのインタフェースでデータを開発、整理、実行、共有することが
コマンドラインまたはクラスタの詳細を参照せずに結果を視覚化 -
- 長いワークフローで実行および共同作業を行う
- は、いくつかのプラグイン言語/データ処理-バックエンド、Scala (apache spark を使用)、Python (apache スパーク付き)、スパーク SQL、JDBC、Markdown、シェルなどの機能を備えています。
- は、スパーク、Flink とマップを削減
とツェッペリンを統合 - は、Apache シロ
とツェッペリンのセキュアなマルチユーザインスタンス

観客

- データエンジニア
- データアナリスト
- データサイエンティスト
- ソフトウェア開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
magellanMagellan: Geospatial Analytics on Spark14 hoursマゼランは、ビッグデータの地理空間解析のためのオープンソースの分散実行エンジンです。Apache spark の上に実装され、それはスパーク SQL を拡張し、地理空間解析のためのリレーショナル抽象化を提供しています。

は、このインストラクター主導の、ライブトレーニングは、geospacial 分析を実装するための概念とアプローチを紹介し、スパークにマゼランを使用して予測分析アプリケーションの作成を通じて参加者を歩く。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、縮尺
で地理空間データセットを効率的にクエリー、パース、結合します。 - ビジネスインテリジェンスおよび予測分析アプリケーションに地理空間データを実装する
- は、空間コンテキストを使用して、モバイルデバイス、センサー、ログ、およびウェアラブルの機能を拡張し

観客

- アプリケーション開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
hdpHortonworks Data Platform (HDP) for Administrators21 hoursHortonworks データプラットフォームは、apache hadoop エコシステム上でビッグデータソリューションを開発するための安定した基盤を提供するオープンソースの apache hadoop サポートプラットフォームです。

このインストラクター主導のライブトレーニングでは、Spark + Hadoop ソリューションの展開を通じて、Hortonworks とウォーク参加者を紹介します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は Hortonworks を使用して、Hadoop を大規模で確実に実行する
- は、Hadoop & #39 のセキュリティ、ガバナンス、オペレーション機能をスパーク & #39 と統合し、アジャイル分析ワークフローを実現します。
- は Hortonworks を使用して、スパークプロジェクトの各コンポーネントを調査、検証、認定、およびサポートします
- では、構造化、非構造化、インモーション、および休止など、さまざまな種類のデータを処理できます。

観客

- Hadoop 管理者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
PentahoDIPentaho Data Integration Fundamentals21 hoursPentaho データ統合は、ジョブとデータ変換を定義するためのオープンソースのデータ統合ツールです。

このインストラクター主導のライブトレーニングでは、Pentaho データ統合 & #39 を使用する方法について説明します。強力な ETL 機能とリッチ・ GUI により、ビッグ・データのライフサイクル全体を管理し、データの価値を組織に最大化します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- ステップとホップを含む基本的なデータ変換を作成、プレビュー、および実行する
- Pentaho エンタープライズリポジトリの構成とセキュリティ保護
- は、データの異なるソースをハーネス化し、アナリティクス対応の形式で単一の統合バージョンの真理を生成します。
- は、さらなる処理のために第3部のアプリケーションに結果を提供する

観客

- データアナリスト
- ETL の開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
TalendDITalend Open Studio for Data Integration 28 hoursデータ統合のための

才能オープンスタジオは、ビジネス全体のさまざまな場所でデータを結合、変換、および更新するために使用されるオープンソースのデータ統合製品です。

このインストラクター主導のライブトレーニングでは、才能 ETL ツールを使用してデータ変換、データ抽出、および Hadoop、ハイブ、およびブタとの接続を実行する方法について説明します。 このトレーニングの終わりまでに、参加者は

することができます

- ETL (抽出、変換、ロード) と伝播
の背後にある概念を説明します。 - は、Hadoop
と接続するための etl メソッドと etl ツールを定義します。 - は、ビジネス要件に応じてビッグデータを効率的に蓄積、取得、ダイジェスト、消費、変換、および形状に
- は、Hadoop (オプション)、Hive (オプション)、および NoSQL データベースから大きなレコードをアップロードして抽出します

観客

- ビジネスインテリジェンスプロフェッショナル
- プロジェクトマネージャー
- データベースの専門家
- SQL 開発者
- ETL の開発者
- ソリューションアーキテクト
- データアーキテクト
- データウェアハウスの専門家
- システム管理者およびインテグレータ
コース の

形式

- 部講義、パート討論、演習と重い実地練習

ノート

- このコースのためのカスタマイズされた訓練を要求するために、整理するために私達に連絡しなさい。
BDATRBig Data Analytics for Telecom Regulators16 hoursは、レギュレータ、csp (通信サービスプロバイダ) のコンプライアンスを満たすために大きなにタップすることができます データ分析によって、コンプライアンスに対応するだけでなく、同じ範囲内でも 顧客満足度を高めることができるため、解約を減らすことができます。実際には、以来、 コンプライアンスは、契約に結び付けられたサービスの品質に関連しており、 の会議に向けたイニシアティブ コンプライアンスは、csp の "競争力" を向上させます。そのため、 レギュレータは、csp に関するビッグデータ分析手法のセットをアドバイス/ガイドすることができるはずです レギュレータと csp の間に相互利益があります。

2 日コース: 8 モジュール、各2時間 = 16 時間
sparkpythonPython and Spark for Big Data (PySpark)21 hoursPython は、その明確な構文とコード readibility のための高レベルのプログラミング言語です。Spark は、ビッグデータのクエリ、分析、および変換に使用されるデータ処理エンジンです。PySpark を使用すると、ユーザーは Python でスパークをインターフェイスできます。

このインストラクター主導のライブトレーニングでは、参加者は、Python を使用して、実践的な演習で動作するようにビッグデータを分析するために一緒にスパークする方法を学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、ビッグデータを分析するために Python でスパークを使用する方法を学ぶ
- は、現実世界の状況を模倣する演習に取り組んで
- は PySpark
を使用してビッグデータ分析のためのさまざまなツールやテクニックを使用する

観客

- 開発者
- it プロフェッショナル
- データサイエンティスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
ambariApache Ambari: Efficiently Manage Hadoop Clusters21 hoursapache Ambari は、apache Hadoop クラスターのプロビジョニング、管理、監視、およびセキュリティ保護のためのオープンソースの管理プラットフォームです。

このインストラクター主導のライブトレーニング参加者は、Hadoop クラスターを正常に管理するために Ambari によって提供される管理ツールとプラクティスを学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は Ambari
を使用してライブビッグデータクラスタをセットアップする - は、さまざまなユースケースに Ambari & #39 の高度な機能と機能性を適用し
- をシームレスに追加し、必要に応じてノードを削除
- により、Hadoop クラスターと #39 のパフォーマンスを向上させることができます。
のチューニングと調整

観客

- DevOps
- システム管理者
- dba
- Hadoop テストの専門家
コース の

形式

- 部講義、パート討論、演習と重い実地練習
foundrFoundation R7 hoursコースの目的は、参加者が R の基礎とデータの操作方法を習得できるようにすることです。
sparkcloudApache Spark in the Cloud21 hoursアパッチスパーク & #39; s の学習曲線が徐々に最初に増加している, それは最初のリターンを取得するための努力の多くの を必要とする.このコースは、最初のタフな部分を介してジャンプを目指しています。参加者は、Apache のスパーク の基本 理解するこのコースを受講した後、彼らは明らかにデータフレームから RDD を区別する、彼らは Python と Scala の API を学ぶことが、彼らはエグゼキュータやタスクなどを理解する もベストプラクティスに従って、このコースはクラウドの展開、Databricks、および AWS に重点を置いています。また、aws の最新のスパークサービスの1つである aws EMR と aws グルーの違いについても説明します。

オーディエンス:

データエンジニア、DevOps、データサイエンティスト
bigdataanahealthBig Data Analytics in Health21 hoursビッグデータ分析は、相関関係、隠されたパターン、およびその他の有用な洞察を明らかにするために、多様なデータセットを大量に調べるプロセスを伴います。

健康産業は、複雑な異種医療および臨床データを大量に持っています。ヘルスデータにビッグデータ分析を適用すると、医療の配信を向上させるための洞察を引き出す大きな可能性があります。しかし、これらのデータセットの恐ろしさは、臨床環境への解析や実用化に大きな課題をもたらしています。

このインストラクター主導の, ライブトレーニング (リモート), 参加者は、彼らが実践的なライブラボの演習の一連のステップとして、健康でビッグデータ分析を実行する方法を学びます.

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Hadoop MapReduce やスパーク
などのビッグデータ分析ツールをインストールして構成する - 医療データの特徴を理解する
- は、医療データに対処するためにビッグデータ技術を適用する
- は、健康アプリケーションのコンテキストでビッグデータシステムとアルゴリズムを研究

観客

- 開発者
- データサイエンティスト
コース の

形式

- パートの講義、一部の議論、演習と重い実践的な練習。

ノート

- このコースのためのカスタマイズされた訓練を要求するために、整理するために私達に連絡しなさい。
sqoopMoving Data from MySQL to Hadoop with Sqoop14 hoursSqoop は、Hadoop とリレーショナル・データベースまたはメインフレーム間でデータを転送するためのオープン・ソース・ソフトウェア・ツールです。MySQL や Oracle、メインフレームなどのリレーショナルデータベース管理システム (RDBMS) から Hadoop 分散ファイルシステム (HDFS) にデータをインポートするために使用できます。その後、Hadoop MapReduce でデータを変換してから、再び RDBMS にエクスポートし直すことができます。

このインストラクター主導のライブトレーニングでは、Sqoop を使用して従来のリレーショナルデータベースから HDFS やハイブなどの Hadoop ストレージにデータをインポートする方法について説明します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Sqoop
のインストールと設定 - から HDFS とハイブ
にデータをインポートする HDFS とハイブから MySQL にデータをインポート -

観客

- システム管理者
- データエンジニア

形式 コース

- 部講義、パート討論、演習と重い実地練習

ノート

- このコースのためのカスタマイズされた訓練を要求するために、整理するために私達に連絡しなさい。
beamUnified Batch and Stream Processing with Apache Beam14 hoursApache ビームは、並列データ処理パイプラインを定義および実行するためのオープンソースで統一されたプログラミングモデルです。It & #39; s パワーは、バッチとストリーミングパイプラインの両方を実行する能力にあり、ビーム & #39 のいずれかによって実行されています。サポートされている分散処理バックエンド: apache Apex、apache Flink、apache Spark、および Google クラウドデータフロー。Apache ビームは、異なるストレージ・メディアとデータ・ソース間でデータを移動したり、データをより望ましい形式に変換したり、新しいシステムにデータを読み込んだりするなど、ETL (抽出、変換、ロード) タスクに便利です。

このインストラクター主導のライブトレーニング (オンサイトまたはリモート) では、ビッグデータセットを小さなチャンクに分解して独立したデータ処理パイプラインを定義する Java または Python アプリケーションで Apache ビーム sdk を実装する方法を学習します。並列処理

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Apache ビームをインストールして設定します。
- は、1つのプログラミングモデルを使用して、Java または Python アプリケーションの以内から、バッチ処理とストリームプロセッシングの両方を実行します。
- は複数の環境でパイプラインを実行します。

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習

ノート

- このコースは、将来的に利用可能な Scala になります。
の手配はお問い合わせください。
pentahoPentaho Open Source BI Suite Community Edition (CE)28 hoursPentaho オープンソース BI Suite コミュニティエディション (CE) は、データ統合、レポート作成、ダッシュボード、および負荷機能を提供するビジネスインテリジェンスパッケージです。

このインストラクター主導の、ライブトレーニングでは、参加者はどのように Pentaho オープンソースの BI Suite のコミュニティエディション (CE) の機能を最大限に学ぶことができます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Pentaho オープンソース BI スイートコミュニティエディション (CE)
のインストールと設定 - は、Pentaho CE ツールとその機能の基礎を理解して
Pentaho CE を使用してレポートをビルド - サードパーティのデータを Pentaho CE
に統合 - Pentaho CE
におけるビッグデータとアナリティクスの - 作業

観客

- プログラマ
- BI 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習

ノート

- このコースのためのカスタマイズされた訓練を要求するために、整理するために私達に連絡しなさい。
週末ビッグデータコース, 夜のビッグデータトレーニング, ビッグデータブートキャンプ, ビッグデータ インストラクターよる, 週末ビッグデータトレーニング, 夜のビッグデータコース, ビッグデータ指導, ビッグデータインストラクター, ビッグデータレーナー, ビッグデータレーナーコース, ビッグデータクラス, ビッグデータオンサイト, ビッグデータプライベートコース, ビッグデータ1対1のトレーニング

コース割引のニュースレター

We respect the privacy of your email address. We will not pass on or sell your address to others.
You can always change your preferences or unsubscribe completely.

一部のお客様

is growing fast!

We are looking to expand our presence in Japan!

As a Business Development Manager you will:

  • expand business in Japan
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!