ビッグデータのトレーニングコース | Big Dataのトレーニングコース

ビッグデータのトレーニングコース

現地のインストラクターによるライブビッグデータトレーニングコースは、ビッグデータの基本概念の紹介から始め、データ分析を実行するために使用されるプログラミング言語と方法論へと進んでいきます。ビッグデータストレージ、分散処理、およびスケーラビリティを実現するためのツールとインフラストラクチャについては、デモ演習セッションで説明し、比較し、実装します。ビッグデータトレーニングは、「オンサイトライブトレーニング」または「リモートライブトレーニング」として利用できます。現地でのトレーニングは、 NobleProg提携の企業研修センターで受講可能です。リモートライブトレーニングは、インタラクティブなリモートデスクトップを介して実行されます。

お客様の声

★★★★★
★★★★★

ビッグデータコース概要

Title
期間
概要
Title
期間
概要
14 hours
概要
Go :

自立のレベルでSPSSと働くことを学ぶ

受取人:

アナリスト、研究者、科学者、学生、そしてSPSSパッケージを使用して人気のあるデータマイニング技術を習得したい人すべて。
7 hours
概要
Apache NiFi (Hortonworks DataFlow)は、システム間のデータの移動、追跡、および自動化を可能にするリアルタイム統合データロジスティクスおよび単純なイベント処理プラットフォームです。フローベースのプログラミングを使用して書かれており、リアルタイムでデータフローを管理するためのWebベースのユーザーインターフェースを提供します。

この講師主導のライブトレーニングでは、 Apache NiFiを使用して多数のデモ拡張機能、コンポーネント、およびプロセッサを開発する際に、参加者はフローベースプログラミングの基礎を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- NiFiのアーキテクチャとデータフローの概念を理解する。
- NiFiとサードパーティのAPIを使って拡張機能を開発する。
- カスタムは、独自のApache Nifiプロセッサを開発します。
- 異種で珍しいファイル形式やデータソースからリアルタイムデータを取り込み、処理します。

コースの形式

- インタラクティブな講演と討論
- たくさんの練習と練習。
- ライブラボ環境での実践的な実装。

コースのカスタマイズオプション

- このコースのためのカスタマイズされたトレーニングを要求するには、手配するために私達に連絡してください。
21 hours
概要
Apache ドリルは、Hadoop、NoSQL、およびその他のクラウドおよびファイルストレージシステム用の、スキーマを持たない、分散した、メモリ内の柱状の SQL クエリエンジンです。Apache ドリルの威力は、単一のクエリを使用して複数のデータストアからデータを結合できることです。Apache ドリルは、HBase、MongoDB、MapR、HDFS、MapR、Amazon S3、Azure Blob ストレージ、Google クラウドストレージ、Swift、NAS、ローカルファイルなど、数多くの NoSQL データベースとファイルシステムをサポートしています。Apache ドリルは google BigQuery と呼ばれるインフラサービスとして利用可能なグーグル & #39 の Dremel システムのオープンソースバージョンです。

このインストラクター主導のライブトレーニングでは、参加者は Apache ドリルの基礎を学び、SQL のパワーと利便性を活用して、コードを記述することなく、複数のデータソース間で大きなデータを対話的に照会することができます。参加者は、分散 SQL 実行のドリルクエリを最適化する方法についても学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、Hadoop
上の構造化および半構造化データに "セルフサービス" 探査を実行します。 - クエリは、SQL クエリを使用して不明なデータと同様に知られて
- は、Apache ドリルがどのようにクエリを受け取り、実行するかを理解する
- は、Hive の構造化データ、HBase または MapR テーブルの半構造化データ、寄木細工や JSON などのファイルに保存されたデータなど、さまざまな種類のデータを分析するための SQL クエリを作成します。
- は Apache ドリルを使用して、複雑な ETL およびスキーマ操作の必要性をバイパスして、オンザフライのスキーマ検出を実行し
- は、Tableau、Qlikview、MicroStrategy、エクセルなどの BI (ビジネスインテリジェンス) ツールを使用して Apache ドリルを統合し

観客

- データアナリスト
- データサイエンティスト
- SQL プログラマ
コース の

形式

- 部講義、パート討論、演習と重い実地練習
28 hours
概要
MonetDB は、コラムストア技術のアプローチを開拓したオープンソースのデータベースです。

このインストラクター主導の、ライブトレーニングでは、参加者はどのように MonetDB を使用して、どのようにそれから最も価値を得るために学ぶことができます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- MonetDB とその特徴を理解する
- のインストールと MonetDB
を開始 - MonetDB
でさまざまな機能やタスクを探索して実行する - は、MonetDB 機能を最大限に活用して、プロジェクトの配信を加速し

観客

- 開発者
- 技術専門家
コース の

形式

- 部講義、パート討論、演習と重い実地練習
28 hours
概要
Mem SQLは、クラウドおよびオンプレミス用のインメモリの分散型SQLデータベース管理システムです。リアルタイムのデータウェアハウスで、ライブデータと履歴データからすぐに洞察を得られます。

この講師主導のライブトレーニングでは、参加者は開発と管理のためのMem SQLの本質を学びSQL 。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- Mem SQL主な概念と特徴を理解する
- Mem SQLインストール、設計、保守、および運用
- Mem SQLスキーマを最適化する
- Mem SQLクエリを改善する
- Mem SQLベンチマークパフォーマンス
- Mem SQLを使用してリアルタイムデータアプリケーションを構築する

観客

- 開発者
- 管理者
- 運用エンジニア

コースの形式

- パートレクチャー、パートディスカッション、エクササイズ、そして激しい実習
28 hours
概要
Hadoop は、大規模なデータ処理フレームワークとして人気があります。Python は、その明確な構文とコード readibility のための有名な高レベルのプログラミング言語です。

このインストラクター主導のライブトレーニングでは、複数の例とユースケースをステップ実行する際に、Python を使用して Hadoop、MapReduce、Pig、スパークを操作する方法を受講者が学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、Hadoop、MapReduce、ブタ、スパーク
の背後にある基本的な概念を理解しています。 - は、Hadoop 分散ファイルシステム (HDFS)、MapReduce、ブタ、およびスパーク
で Python を使用します。 - ヘビを使用して、Python
内の HDFS にプログラムでアクセスする - は mrjob を使用して MapReduce のジョブを Python
に書き込みます。 - は、Python
でスパークプログラムを書く - は、Python udf を使用してブタの機能を拡張し
ルイージ を使用して MapReduce ジョブとブタのスクリプトを管理 -

観客

- 開発者
- it プロフェッショナル
コース の

形式

- 部講義、パート討論、演習と重い実地練習
21 hours
概要
Pythonはその明確な構文とコードの読みやすさで有名な高水準プログラミング言語です。 Sparkは、ビッグデータのクエリ、分析、および変換に使用されるデータ処理エンジンです。 PySparkは、ユーザーがSparkとPythonをインターフェースすることを可能にします。

このインストラクター主導のライブトレーニングでは、参加者はPythonとSparkを併用してビッグデータを分析し、実践的な演習を行う方法を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- Python Sparkを使用してBig Dataを分析する方法を学びましょう。
- 現実の世界の状況を模した演習に取り組む。
- PySparkを使用したビッグデータ分析には、さまざまなツールや技法を使用してPySpark 。

コースの形式

- パートレクチャー、パートディスカッション、エクササイズ、そして激しい実習
35 hours
概要
技術の進歩と情報量の増加は、法執行機関の実施方法を変革しています。ビッグデータがもたらす課題は、ビッグデータと #39 の約束とほぼ同じくらい困難です。データを効率的に格納することは、これらの課題の1つです。それを効果的に分析することは別です。

は、このインストラクター主導の、ライブトレーニングでは、参加者は、ビッグデータ技術にアプローチするための考え方を学び、既存のプロセスや政策への影響を評価し、犯罪者を識別する目的のためにこれらの技術を実装する活動と犯罪を防止する。世界中の法執行機関からのケーススタディは、彼らの採用のアプローチ、課題と結果についての洞察を得るために検討されます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は調査の間に物語をつなぎ合わせるために従来のデータ収集プロセスとビッグデータ技術を結合する
- は、データ解析のための産業用ビッグデータストレージおよび処理ソリューションを実装
- は、犯罪捜査にデータ駆動型のアプローチを有効にするための最も適切なツールとプロセスの採用のための提案を準備する

観客

技術的な背景を持つ - 法執行機関のスペシャリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
14 hours
概要
規制当局のコンプライアンスを満たすために、CSP( Communicationサービスプロバイダ)はビッグデータ分析を活用して、コンプライアンスの達成を支援するだけでなく、同じプロジェクトの範囲内で顧客満足度を高め、それにより解約を減らすことができます。実際、コンプライアンスは契約に結び付けられたサービスの質に関連しているため、コンプライアンスを満たすためのあらゆるイニシアチブはCSPの「競争力」を向上させます。したがって、規制当局は、規制当局とCSPの間で相互に利益をもたらすことになる、CSPのための一連のBig Data分析慣行を助言/指導することができるべきであることが重要です。

コースは8つのモジュールで構成されています(1日目に4つ、2日目に4つ)
28 hours
概要
実世界の多くの問題はグラフで説明できます。たとえば、Webグラフ、ソーシャルネットワークグラフ、電車ネットワークグラフ、言語グラフなどです。これらのグラフは非常に大きくなる傾向があります。それらを処理するには、特殊なツールとプロセスのセットが必要です。これらのツールとプロセスは、 Graph Computing (Graph Analyticsとも呼ばれます)と呼ぶことができます。

この講師主導のライブトレーニングでは、参加者は、グラフデータを処理するためのテクノロジの提供および実装方法について学習します。目的は、実世界のオブジェクト、それらの特性および関係を識別し、次にこれらの関係をモデル化し、 Graph Computing (Graph Analyticsとも呼ばれる)アプローチを使用してデータとして処理することです。一連のケーススタディ、実践的な演習、および実際の展開を順を追って進める中で、まず概要を概説し、特定のツールを絞り込みます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- グラフデータがどのように保持されトラバースされるのかを理解する。
- 特定のタスクに最適なフレームワークを選択します(グラフデータベースからバッチ処理フレームワークまで)。
- Hadoop 、Spark、 GraphX 、およびPregelを実装して、多数のマシンで並行してグラフコンピューティングを実行します。
- グラフ、プロセス、およびトラバースの観点から、実世界のビッグデータの問題を表示します。

コースの形式

- パートレクチャー、パートディスカッション、エクササイズ、そして激しい実習
21 hours
概要
予測分析は、データ分析を使用して将来に関する予測を行うプロセスです。このプロセスでは、データマイニング、統計、および機械学習の手法と共にデータを使用して、将来のイベントを予測するための予測モデルを作成します。

このインストラクター主導のライブトレーニングでは、Matlab を使用して予測モデルを作成し、それらを大規模なサンプルデータセットに適用して、データに基づいて将来のイベントを予測する方法について説明します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- 予測モデルを作成して、履歴データとトランザクション
のパターンを分析します。 - 予測モデリングを使用してリスクとオポチュニティを特定する
- は重要な傾向を取り込む数学的モデルを構築する
- は、デバイスやビジネスシステムのデータを使用して、廃棄物の削減、時間の節約、コスト削減を

観客

- 開発者
- エンジニア
- ドメインの専門家
コース の

形式

- 部講義、パート討論、演習と重い実地練習
21 hours
概要
Apache NiFi (Hortonworks DataFlow)は、システム間のデータの移動、追跡、および自動化を可能にするリアルタイム統合データロジスティクスおよび単純なイベント処理プラットフォームです。フローベースのプログラミングを使用して書かれており、リアルタイムでデータフローを管理するためのWebベースのユーザーインターフェースを提供します。

この講師主導のライブトレーニング(オンサイトまたはリモート)では、参加者はライブラボ環境でのApache NiFi配置および管理方法を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- Apachi NiFiをインストールして設定します。
- データベースやビッグデータレーキなど、異種の分散データソースからデータを取得、変換、管理します。
- データフローを自動化します。
- ストリーミング分析を有効にします。
- データ取り込みにさまざまなアプローチを適用します。
- Big Dataをビジネス洞察に変換します。

コースの形式

- インタラクティブな講演と討論
- たくさんの練習と練習。
- ライブラボ環境での実践的な実装。

コースのカスタマイズオプション

- このコースのためのカスタマイズされたトレーニングを要求するには、手配するために私達に連絡してください。
7 hours
概要
この講師主導のライブトレーニングでは、参加者はリアルタイムストリーミングアプリケーションを開発する際に、MapR Stream Architectureの背後にあるコアコンセプトを学びます。

このトレーニングの終わりまでに、参加者はリアルタイムのストリームデータ処理のためのプロデューサアプリケーションとコンシューマアプリケーションを構築できるようになります。

観客

- 開発者
- 管理者

コースの形式

- パートレクチャー、パートディスカッション、エクササイズ、そして激しい実習

注意

- このコースのためのカスタマイズされたトレーニングを要求するには、手配するために私達に連絡してください。
14 hours
概要
Apache SolrCloud は分散型ネットワーク上のファイルの検索とインデックス作成を容易にする分散データ処理エンジンです。

このインストラクター主導のライブトレーニングでは、参加者は Amazon AWS で SolrCloud インスタンスを設定する方法を学習します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、SolCloud & #39 の特徴と、それらが従来のマスタスレーブクラスタとどのように比較されるかを理解して
- SolCloud 集中クラスタを構成する
- は、シャードとの通信、シャードへのドキュメントの追加などのプロセスを自動化します
- は、SolrCloud と連携して飼育係を使用して、プロセスをさらに自動化し
- インターフェイスを使用してエラー報告を管理する
- 負荷分散 SolrCloud インストール
- 連続処理およびフェイルオーバー
のための SolrCloud の構成

観客

- Solr 開発者
- プロジェクトマネージャー
- システム管理者
- 検索アナリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
28 hours
概要
データボールトのモデリングは、複数のソースから発生するデータの長期的な履歴保存を提供するデータベースのモデリング手法です。データボールトは、ファクトの1つのバージョン、またはすべてのデータを "、すべての時間" を格納します。その柔軟性、拡張性、一貫性、適応性に優れたデザインは、第3正規形 (3NF) とスタースキーマの最高の側面を網羅しています。

このインストラクター主導の、ライブトレーニングでは、参加者はどのようにデータボールトを構築する方法を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、データボールト2.0 の背後にあるアーキテクチャと設計の概念、およびビッグデータ、NoSQL と AI との相互作用を理解しています。
- では、データ保管技術を使用して、データウェアハウスの履歴データの監査、トレース、および検査を有効に
- は一貫性のある再現性のある ETL (抽出、変換、ロード) プロセスを開発し
- は、拡張性と再現性に優れた倉庫を構築および展開します

観客

- データモデラー
- データウェアハウススペシャリスト
- ビジネスインテリジェンススペシャリスト
- データエンジニア
- データベース管理者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
14 hours
概要
Datameer は、Hadoop 上に構築されたビジネスインテリジェンスおよびアナリティクスプラットフォームです。これにより、エンドユーザーは、使いやすい方法で、大規模な構造化された半構造化データと非構造化情報にアクセスし、探索し、関連づけることができます。

このインストラクター主導のライブトレーニングでは、Datameer を使用して Hadoop & #39 を克服する方法について学習し、一連のビッグデータソースのセットアップと分析を段階的に実行します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- エンタープライズデータを作成、バーテン、対話的に探索する
湖 - アクセスビジネスインテリジェンスデータウェアハウス、トランザクションデータベース、およびその他の分析ストア
- エンドツーエンドのデータ処理パイプラインを設計するには、スプレッドシートのユーザーインターフェイスを使用します
- アクセス事前に構築された関数は、複雑なデータの関係を探るために
- ドラッグアンドドロップウィザードを使用してデータを視覚化し、ダッシュボードを作成する
- テーブル、グラフ、グラフ、およびマップを使用してクエリ結果を分析する

観客

- データアナリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習
14 hours
概要
タイゴンは、オープンソース、リアルタイム、低レイテンシ、高スループット、ネイティブヤーン、持続性のために HDFS と HBase の上に位置するストリーム処理フレームワークです。タイゴンアプリケーションは、ネットワーク侵入検知と分析、ソーシャルメディア市場分析、ロケーション分析、ユーザーへのリアルタイムの推奨などのユースケースに対応しています。

は、このインストラクター主導のライブトレーニングでは、サンプルアプリケーションの作成を通じて参加者をウォークする際に、リアルタイムおよびバッチ処理をブレンドするタイゴン & #39 のアプローチを紹介します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- は、大量のデータを処理するための強力なストリーム処理アプリケーションを作成し
- は、Twitter やウェブサーバのログなどのプロセスストリームのソースを
- は、ストリームの迅速な結合、フィルタリング、および集約のためにタイゴンを使用し

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
14 hours
概要
Apache Igniteは、速度とスケール、可用性を向上させるために、アプリケーションとデータ層の間に位置するインメモリコンピューティングプラットフォームです。

このインストラクター主導のライブトレーニングでは、参加者は、サンプルのインメモリコンピューティングプロジェクトの作成を段階的に進めながら、永続的で純粋なインメモリストレージの背後にある原理を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- Igniteは、メモリ内、ディスク上の永続性、および純粋に分散されたメモリ内データベースに使用します。
- データをリレーショナルデータベースに同期せずに永続性を実現します。
- Igniteを使用して、 SQLおよび分散結合を実行しSQL 。
- RAMをストレージとして使用して、データをCPUに近づけることにより、パフォーマンスを向上させます。
- クラスター全体にデータセットを分散して、水平方向のスケーラビリティを実現します。
- IgniteをRDBMS、No SQL 、 Hadoop 、機械学習プロセッサと統合します。

コースの形式

- インタラクティブな講義とディスカッション。
- たくさんの練習と練習。
- ライブラボ環境での実践的な実装。

コースのカスタマイズオプション

- このコースのカスタマイズされたトレーニングをリクエストするには、お問い合わせください。
14 hours
概要
ベスパは、オープンソースのビッグデータ処理とエンジンを提供するヤフーによって作成されます。 ユーザーのクエリに応答し、推奨事項を作成し、パーソナライズされたコンテンツと広告をリアルタイムで提供するために使用します。

は、このインストラクター主導のライブトレーニングでは、大規模なデータを提供するという課題を紹介し、ユーザーの要求への応答を計算できるアプリケーションを作成することにより、参加者をリアルタイムで大量に処理します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- を使用してベスパはすぐにデータを計算する (ストア, 検索, ランク, 整理) ユーザーが待機している間に時間を提供する
- は、機能検索、推奨事項、およびパーソナライゼーション
を含む既存のアプリケーションにベスパを実装します。 - は、Hadoop やストームなどの既存のビッグデータシステムとベスパを統合して展開します。

観客

- 開発者
コース の

形式

- 部講義、パート討論、演習と重い実地練習
21 hours
概要
Apache Apexは、ストリームとバッチ処理を統合するYARNネイティブプラットフォームです。動作中のビッグデータを、スケーラブル、パフォーマンス、フォールトトレラント、ステートフル、安全、分散、簡単に操作できる方法で処理します。

このインストラクター主導のライブトレーニングでは、 Apache Apexの統合ストリーム処理アーキテクチャを紹介し、Apex on Hadoopを使用して分散アプリケーションを作成する方法を説明します。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- ソースとシンクのコネクタ、一般的なデータ変換などのデータ処理パイプラインの概念を理解する
- Apexアプリケーションの構築、スケーリング、最適化
- リアルタイムデータストリームを最小限のレイテンシで確実に処理します
- Apex CoreとApex Malharライブラリを使用して、迅速なアプリケーション開発を可能にします
- Apex APIを使用して、既存のJavaコードを作成して再利用する
- Apexを処理エンジンとして他のアプリケーションに統合する
- Apexアプリケーションの調整、テスト、スケーリング

コースの形式

- インタラクティブな講義とディスカッション。
- たくさんの練習と練習。
- ライブラボ環境での実践的な実装。

コースのカスタマイズオプション

- このコースのカスタマイズされたトレーニングをリクエストするには、お問い合わせください。
7 hours
概要
Alluxioは、異種ストレージシステムをAlluxio 、アプリケーションがメモリ速度でデータと対話できるようにするオープンソースの仮想分散ストレージシステムです。 Intel、Baidu、Alibabaなどの企業で使用されています。

このインストラクター主導のライブトレーニングでは、参加者は、 Alluxioを使用してさまざまな計算フレームワークをストレージシステムとブリッジし、 Alluxioを使用してアプリケーションの作成を段階的にAlluxioマルチペタバイトスケールデータを効率的に管理する方法をAlluxioます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- Alluxio使用してアプリケーションを開発する
- 1つのネームスペースを保持しながら、ビッグデータシステムとアプリケーションを接続します
- 任意のストレージ形式のビッグデータから効率的に値を抽出します
- ワークロードのパフォーマンスを改善する
- Alluxioスタンドアロンまたはクラスター化の展開と管理

聴衆

- データサイエンティスト
- 開発者
- システム管理者

コースの形式

- 一部の講義、一部のディスカッション、演習、および実践的な実践
28 hours
概要
Apache Flink は、スケーラブルなストリームおよびバッチデータ処理のためのオープンソースフレームワークです。

このインストラクター主導の

により、ライブトレーニングは、分散ストリームとバッチデータ処理の背後にある原則とアプローチを紹介し、Apache Flink でリアルタイムのデータストリーミングアプリケーションを作成することによって参加者を歩きます。

このトレーニングが終了すると、参加者は次のことができるようになります。

- は、データ分析アプリケーションを開発するための環境を設定します。
- は、Flink ベースのフォールトトレラントなデータストリーミングアプリケーションをパッケージ化、実行、および監視します。
- は、多様なワークロードを管理します。
- Flink ML を使用して高度な分析を実行します。
- マルチノード Flink クラスタを設定します。
- は、パフォーマンスを測定し、最適化します。
- は、異なるビッグデータシステムと Flink を統合します。
- は、他のビッグデータ処理フレームワークと Flink の機能を比較します。

コースの形式

- パートレクチャー、パートディスカッション、エクササイズ、ヘビーハンズオン練習
14 hours
概要
Apache Samzaは、ストリーム処理用のオープンソースの準リアルタイムの非同期計算フレームワークです。メッセージングにはApache Kafkaを使用し、フォールトトレランス、プロセッサの隔離、セキュリティ、およびリソース管理にはApache Hadoop YARNを使用します。

このインストラクター主導のライブトレーニングでは、サンプルのSamzaベースのプロジェクトの作成とジョブの実行を通じて参加者をウォーキングしながら、メッセージングシステムと分散ストリーム処理の背後にある原則を紹介します。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- Samzaを使用して、メッセージの生成と消費に必要なコードを単純化してください。
- アプリケーションからのメッセージの処理を切り離します。
- Samzaを使用して、ほぼリアルタイムの非同期計算を実装します。
- ストリーム処理を使用して、メッセージングシステムよりも高度な抽象化を提供します。

観客

- 開発者

コースの形式

- パートレクチャー、パートディスカッション、エクササイズ、そして激しい実習
14 hours
概要
AIは、「インテリジェントな決定」をするためにデータとデータを取り巻く活動を理解することができるインテリジェントシステムを構築するための技術の集まりです。テレコムプロバイダにとって、AIを利用するアプリケーションやサービスを構築することは、メンテナンスやネットワークの最適化などの分野における運用とサービスの向上への扉を開くことができます。

このコースでは、AIを構成するさまざまなテクノロジとそれらを使用するために必要なスキルセットを調べます。コース全体を通して、テレコム業界におけるAIの特定のアプリケーションを検証します。

観客

- ネットワークエンジニア
- ネットワーク運用要員
- 通信技術マネージャー

コースの形式

- パートレクチャー、パートディスカッション、実習
7 hours
概要
Apache ドリルは、Hadoop、NoSQL、およびその他のクラウドおよびファイルストレージシステム用の、スキーマを持たない、分散した、メモリ内の柱状の SQL クエリエンジンです。Apache ドリルの威力は、単一のクエリを使用して複数のデータストアからデータを結合できることです。Apache ドリルは、HBase、MongoDB、MapR、HDFS、MapR、Amazon S3、Azure Blob ストレージ、Google クラウドストレージ、Swift、NAS、ローカルファイルなど、数多くの NoSQL データベースとファイルシステムをサポートしています。Apache ドリルは google BigQuery と呼ばれるインフラサービスとして利用可能なグーグル & #39 の Dremel システムのオープンソースバージョンです。

このインストラクター主導のライブトレーニングでは、非常に大きなデータセットに対するクエリのパフォーマンスを向上させるために Apache ドリルを最適化およびデバッグする方法について説明します。このコースは、Apache ドリルと他の対話型データ分析ツールのアーキテクチャの概要と機能の比較から始まります。参加者は、インストール、構成、パフォーマンス評価、クエリの最適化、データのパーティション分割、ライブラボ環境での Apache ドリルインスタンスのデバッグなど、一連の対話型の実践的な実習セッションをステップ実行します。

このトレーニングの終わりまでに、参加者は次のことができるようになります:

- Apache ドリル
のインストールと設定 - は、Apache のドリル & #39 を理解している; s アーキテクチャと機能
- は、Apache ドリルがどのようにクエリを受け取り、実行するかを理解する
- 分散 SQL 実行
のドリルクエリの最適化 - デバッグアパッチドリル

観客

- 開発者
- システム管理者
- データアナリスト
コース の

形式

- 部講義、パート討論、演習と重い実地練習

ノート

- このコースのためのカスタマイズされた訓練を要求するために、整理するために私達に連絡しなさい。
14 hours
概要
Magellanは、ビッグデータの地理空間分析のためのオープンソースの分散実行エンジンです。 Apache Spark上に実装され、Spark SQLを拡張し、地理空間分析のリレーショナル抽象化を提供します。

このインストラクター主導のライブトレーニングでは、地理空間分析を実装するための概念とアプローチを紹介し、SparkでMagellanを使用して予測分析アプリケーションを作成する方法を説明します。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- 大規模な地理空間データセットの効率的なクエリ、解析、結合
- ビジネスインテリジェンスおよび予測分析アプリケーションで地理空間データを実装する
- 空間コンテキストを使用して、モバイルデバイス、センサー、ログ、ウェアラブルの機能を拡張します

コースの形式

- インタラクティブな講義とディスカッション。
- たくさんの練習と練習。
- ライブラボ環境での実践的な実装。

コースのカスタマイズオプション

- このコースのカスタマイズされたトレーニングをリクエストするには、お問い合わせください。
14 hours
概要
Apache Arrowはオープンソースのインメモリデータ処理フレームワークです。分析のために異なるデータストアにアクセスするために、他のデータサイエンスツールと一緒に使用されることがよくあります。 GPUデータベース、機械学習ライブラリおよびツール、実行エンジン、データ視覚化フレームワークなどの他のテクノロジとうまく統合されています。

このオンサイトのインストラクター主導のライブトレーニングでは、参加者はApache ArrowをさまざまなData Scienceフレームワークと統合して異種のデータソースからデータにアクセスする方法を学びます。

このトレーニングの終わりまでに、参加者は次のことができるようになります。

- 分散クラスター環境でApache Arrowをインストールして構成する
- Apache Arrowを使って異種のデータソースからデータにアクセスする
- Apache Arrowを使用して、複雑なETLパイプラインを構築および維持する必要性を回避します
- 一元化されたリポジトリに統合することなく、異なるデータソース間でデータを分析

観客

- データ科学者
- データエンジニア

コースの 形式

- パートレクチャー、パートディスカッション、エクササイズ、そして激しい実習

注意

- このコースのためのカスタマイズされたトレーニングを要求するには、手配するために私達に連絡してください。
7 hours
概要
このインストラクター主導のライブトレーニング(オンサイトまたはリモート)は、ビッグデータを最大限に活用しながら機械学習戦略を実装する方法を学びたい技術者を対象としています。

このトレーニングの終わりまでに、参加者は以下のことを行います。

- 機械学習の進化と傾向を理解する
- 機械学習がさまざまな業界でどのように使用されているかを知ってください。
- 組織内で機械学習を実装するために利用できるツール、スキル、およびサービスに精通してください。
- データマイニングと分析を強化するために機械学習をどのように使用できるかを理解します。
- データミドルバックエンドとは何か、そしてそれが企業によってどのように使用されているかを学びましょう。
- ビッグデータとインテリジェントアプリケーションが業界全体で果たしている役割を理解します。

コースの形式

- インタラクティブな講演と討論
- たくさんの練習と練習。
- ライブラボ環境での実践的な実装。

コースのカスタマイズオプション

- このコースのためのカスタマイズされたトレーニングを要求するには、手配するために私達に連絡してください。
14 hours
概要
Teradata is a popular Relational Database Management System for building large scale data warehousing applications. Teradata achieves this by way of parallelism.

This instructor-led, live training (onsite or remote) is aimed at application developers and engineers who wish to master more sophisticated usages of the Teradata database.

By the end of this training, participants will be able to:

- Manage Teradata space.
- Protect and distribute data in Teradata.
- Read Explain Plan.
- Improve SQL proficiency.
- Use main utilities of Teradata.

Format of the Course

- Interactive lecture and discussion.
- Lots of exercises and practice.
- Hands-on implementation in a live-lab environment.

Course Customization Options

- To request a customized training for this course, please contact us to arrange.
35 hours
概要
KNIME is a free and open-source data analytics, reporting and integration platform. KNIME integrates various components for machine learning and data mining through its modular data pipelining concept. A graphical user interface and use of JDBC allows assembly of nodes blending different data sources, including preprocessing (ETL: Extraction, Transformation, Loading), for modeling, data analysis and visualization without, or with only minimal, programming. To some extent as advanced analytics tool KNIME can be considered as a SAS alternative.

Since 2006, KNIME has been used in pharmaceutical research, it also used in other areas like CRM customer data analysis, business intelligence and financial data analysis.
週末ビッグデータコース, 夜のビッグデータトレーニング, ビッグデータブートキャンプ, ビッグデータ インストラクターよる, 週末ビッグデータトレーニング, 夜のビッグデータコース, ビッグデータ指導, ビッグデータインストラクター, ビッグデータレーナー, ビッグデータレーナーコース, ビッグデータクラス, ビッグデータオンサイト, ビッグデータプライベートコース, ビッグデータ1対1のトレーニング週末Big Dataコース, 夜のBig Dataトレーニング, Big Dataブートキャンプ, Big Data インストラクターよる, 週末Big Dataトレーニング, 夜のBig Dataコース, Big Data指導, Big Dataインストラクター, Big Dataレーナー, Big Dataレーナーコース, Big Dataクラス, Big Dataオンサイト, Big Dataプライベートコース, Big Data1対1のトレーニング

コースプロモーション

一部のお客様

is growing fast!

We are looking to expand our presence in Japan!

As a Business Development Manager you will:

  • expand business in Japan
  • recruit local talent (sales, agents, trainers, consultants)
  • recruit local trainers and consultants

We offer:

  • Artificial Intelligence and Big Data systems to support your local operation
  • high-tech automation
  • continuously upgraded course catalogue and content
  • good fun in international team

If you are interested in running a high-tech, high-quality training and consulting business.

Apply now!