#
0 kết quả
#

Menu

Big Data
Big Data

Giải pháp xử lý và phân tích dữ liệu lớn trên nền điện toán đám mây

#

Background

Big Data là thuật ngữ dùng để chỉ một tập hợp dữ liệu rất lớn và phức tạp đến nỗi những công cụ, ứng dụng xử lý dữ liệu truyền thống không thể nào đảm đương được. Những đặc trưng của Big Data

#

Volume

Sự tăng trưởng về mặt khối lượng

#

Velocity

Sự tăng trưởng về mặt tốc độ

#

Variety

Sự tăng lên về tính đa dạng dữ liệu

#

Varacity

Tính xác thực của dữ liệu

Big Data - MapReduce là một giải pháp có khả năng xử lý và phân tích một lượng dữ liệu khổng lồ. Dựa trên các nền tảng mã nguồn mở Apache Hadoop và Apache Spark, MapReduce xử lý linh hoạt các use case Big Data như phân tích xu thế, lưu trữ dữ liệu và phân tích luồng dữ liệu liên tục. MapReduce trên nền điện toán đám mây đơn giản hoá việc xử lý Big Data, xây dựng dễ dàng, nhanh chóng, có khả năng mở rộng. Với những phân tích dữ liệu thời gian thực, giải pháp tối ưu chi phí cũng như giúp bạn nâng cao hiệu quả kinh doanh.

Solution Architecture #

Giải pháp giúp dễ dàng quản lý và xử lý hàng petabytes dữ liệu có cấu trúc và không cấu trúc như stored logs, database records, …

Solution Architecture
Elastic Compute
Object Storage Service
Web Application
Map-Reduce (Hadoop, Spark, Hive)
Database cluster service (DBaaS)

Giải pháp xử lý và phân tích khối lượng dữ liệu khổng lồ để dự đoán hành vi người dùng, dự báo thời tiết, … MapReduce sẽ thu thập dữ liệu từ cơ sở dữ liệu có quan hệ (relational – MySQL, MariaDB) cũng như không quan hệ (non-relational - MongoDB) vào các datastore như HDFS, HBase. Những dữ liệu này sẽ được phân tích bằng HadoopMapReduce, Apache Spark hoặc Apache Hive. Kết quả phân tích sẽ được tải lên Object Storage Service, Web Application sẽ truy xuất và hiển thị kết quả trên giao diện.

Get $ 300 New User Bank & Finance
Resources
#
Hadoop Cluster Setup
Download
#
Install MongoDB Enterprise on Red-hat
Download
#
Hadoop Cluster Setup
Download
#
Install MongoDB Enterprise on Red-hat
Download
Community