4 min read

Tổng hợp các nguồn học Data

Tổng hợp các nguồn học Data
Photo by Serena Naclerio / Unsplash

Rất nhiều bạn thắc mắc với mình nên bắt đầu từ đâu để trở thành Data Analyst hoặc Data Scientist. Mình đã từng làm một vlog nói thêm về vấn đề này.

Để bổ sung thêm cho vlog này, sau đây là bài tổng hợp những nguồn học giúp bạn rẽ hướng trở thành Data Analyst hoặc Data Scientist, và nâng cao hơn kỹ năng phân tích của bản thân nhé.

Danh sách tham khảo này sẽ được mình bổ sung thêm nếu sau này mình biết thêm các nguồn hữu ích khác.

SQL

Không biết học gì trước thì bắt đầu từ SQL nha!

Python/R

Bạn không cần học cả hai, chỉ cần biết một ngôn ngữ thì học một ngôn ngữ khác dễ dàng hơn rất nhiều.

Tuy nhiên, lưu ý sẽ có những công ty chỉ dùng Python, những công ty khác chỉ dùng R. Bạn hãy tham khảo thêm mô tả công việc của một số công ty bạn mong muốn ứng tuyển để đưa ra lựa chọn phù hợp.

Statistics

  • Beginner level: The cartoon guide to statistics. Xác suất thống kê là một bộ môn khô khan. Bởi vậy nếu bạn thích có nhiều hình ảnh minh hoạ để nhớ bài dễ hơn, mình rất thích quyển sách này.
  • Học sâu hơn về statistical inference và regression qua quyển sách Statistical Inference via Data Science: A ModernDive into R and the Tidyverse. Cuốn sách này dạy cách sử dụng R cho xác suất thống kê và regression. Nếu bạn không dùng R, mình vẫn rất khuyến khích đọc vì mình thấy họ giải thích, bóc tách và xây dựng kiến thức rất dễ hiểu
  • Đọc sâu hơn về regression, hypothesis testing, timeseries với Statistics by Jim. Đây là một blog mà mình tình cờ tìm thấy khi đào sâu hơn về regression analysis. Jim giải thích rất dễ hiểu, với ví dụ cụ thể. Đọc hay đến nỗi mình đã quyết định mua luôn cuốn sách Regression Analysis của tác giả.

Những quyển sách khác:

Data visualization foundation

BI tool

Mỗi công ty có thể có lựa chọn BI tool khác nhau. Chỉ cần bạn có cái nền data visualization tốt thì tool nào bạn cũng có thể dễ dàng học để tạo ra visualization. Sau đây là một số tool mình thấy mọi người hay dùng, nhưng cũng có rất nhiều các tool khác nhé!

Nguồn dữ liệu mở

Nếu bạn cần tìm dữ liệu để luyện tập, làm project, hay cho công việc, bạn có thể tham khảo thêm các nguồn sau:

  • Kaggle
  • Google public data directory
  • Các website chính phủ, tổ chức quốc tế (World Bank, United Nations, vân vân)
  • API hay web scrapping những trang được cho phép

Học để suy nghĩ

Kĩ năng giá trị nhất mà mình thấy quan trọng hơn cả những kĩ năng technical ở trên, đó là khả năng suy nghĩ. Bản thân suy nghĩ một cách hệ thống, nhiều việc phức tạp trở nên dễ hiểu dễ giải quyết hơn. Bạn cũng có thể sử dụng kĩ năng này giúp mọi người xung quanh bóc tách các bài toán nan giải trong công việc.

Có một số quyển sách mình muốn giới thiệu với các bạn vì chúng đã định hướng suy nghĩ của mình rất nhiều:

Những nguồn hữu ích khác

Sau đây là tổng hợp một số nguồn học khác giúp bạn nâng cao kỹ năng phân tích hoặc trở thành người Data Analyst tốt hơn:

Certificate:

Sách:

Tổng hợp các tin tức về công nghệ hay data nói riêng:

Kênh Youtube:

💛
Nếu bạn yêu thích những chia sẻ về data và cuộc sống, subscribe Youtubetrang blog Hà Viết Blog nhé!