Archive of posts with category 'Data'

Kafka Connect

Write-head logging

Query Elasticsearch

Các cách query:

Làm được gì từ web data?

Mở socket » connect đến đường dẫn và port » Tạo biến string cmd request GET, POST,… » encode string cmd thành dạng byte » gửi request đi.

MongoDB cơ bản

Bắt đầu với MongoDB

Setup Airflow cơ bản cần biết

Các bước set-up: https://airflow.apache.org/docs/apache-airflow/stable/start/docker.html

Tìm hiểu về Data Analysis

Bài viết này sẽ hướng dẫn các bước cơ bản: Tìm data phù hợp rồi collect chúng Đọc data trong môi trường dev Chuẩn bị phân tích bằng cách cleaning...

Python - Part 2

1. Dictionaries Là tập hợp các cặp key:value khi cần kết nối dữ liệu với nhau như 1 table để tra cứu nhanh và có thể chỉ ra unique keys...

Import Data - Part 2

1. Import + Load + Tạo HTTP/GET REQUEST Lưu file mềm xuống local: urlretrieve(url, 'filename.csv')

Python - Part 1

I. LIST

(ENG) The basics of Spark PART 1

Đầu tiên phải kết nối với Cluster. Cluster được host trên remote machine mà được connect với tất cả các node khác. Sẽ có 1 máy tính gọi là master...

Data Visualization

1. Các loại chart cơ bản

Set-up phpMyAdmin

Initial setup with Ubuntu 20.4: https://www.digitalocean.com/community/tutorials/initial-server-setup-with-ubuntu-20-04

Import Data - Part 1

1. Flat file

The origin of Database

Đi từ các cấu trúc dữ liệu như Array, Linked list, B-tree,… => Các cấu trúc dl này chỉ lưu những con số, không lưu được 1 tập dữ liệu...

Data Toolbox

Chapter 1 : Các công cụ làm việc trong mảng Data Engineering