大數(shù)據(jù)處理涉及多種核心技術(shù):分布式存儲:hdfs、cassandra、mongodb分布式計算:mapreduce、spark、flink大數(shù)據(jù)分析:hive、pig、r、python數(shù)據(jù)可視化:tableau、power bi、qlikview數(shù)據(jù)集成:talend、informatica、microsoft sql server integration services流式數(shù)據(jù)處理:kafka、storm、flink人工智能和機器學習:tensorflow、pytorch、scikit-le
大數(shù)據(jù)相關(guān)技術(shù)
大數(shù)據(jù)處理涉及廣泛的技術(shù),以下列舉一些核心相關(guān)技術(shù):
1. 分布式存儲
2. 分布式計算
3. 大數(shù)據(jù)分析
- Hive
- Pig
- R
- Python
4. 數(shù)據(jù)可視化
- Tableau
- Power BI
- QlikView
5. 數(shù)據(jù)集成
6. 流式數(shù)據(jù)處理
- Kafka
- Storm
- Flink
7. 人工智能和機器學習
- TensorFlow
- PyTorch
- Scikit-learn
8. 數(shù)據(jù)庫技術(shù)
- 關(guān)系型數(shù)據(jù)庫(如 mysql、oracle)
- nosql 數(shù)據(jù)庫(如 MongoDB、Cassandra)
9. 云計算
- Amazon web services(AWS)
- Microsoft Azure
- Google Cloud Platform
10. 數(shù)據(jù)安全和合規(guī)性
- 加密
- 訪問控制
- 審計