Logo Zephyrnet

5 cuốn sách miễn phí về thống kê tổng thể cho khoa học dữ liệu – KDnuggets

Ngày:

5 cuốn sách miễn phí về thống kê tổng thể cho khoa học dữ liệu
Hình ảnh của Editor
 

Để học khoa học dữ liệu, bạn cũng cần có nền tảng toán học vững chắc. Và thống kê là một trong những kỹ năng toán học cần thiết cho khoa học dữ liệu. 

Tuy nhiên, việc học số liệu thống kê có thể đáng sợ, đặc biệt nếu bạn học chuyên ngành không phải là toán hoặc khoa học máy tính. Để giúp bạn bắt đầu, chúng tôi đã biên soạn một danh sách sách miễn phí giúp bạn có thể truy cập số liệu thống kê về khoa học dữ liệu.

Hầu hết những cuốn sách này đều có cách tiếp cận thực tế với các khái niệm thống kê, đó là những gì bạn cần để sử dụng số liệu thống kê một cách hiệu quả với tư cách là một nhà khoa học dữ liệu. Vì vậy, chúng ta hãy đi qua những cuốn sách thống kê.

Sản phẩm  Thống kê giới thiệu Cuốn sách này là phần giới thiệu dễ tiếp cận về số liệu thống kê bao gồm nội dung mà khóa học thống kê giới thiệu kéo dài một học kỳ ở các trường đại học thường bao gồm. 

Có sẵn để truy cập miễn phí trên OpenStax và được viết bởi một nhóm gồm các tác giả chuyên gia đóng góp, cuốn sách này áp dụng cách tiếp cận thống kê ưu tiên ứng dụng thay vì cách tiếp cận ưu tiên lý thuyết và bao gồm các ví dụ trong bài tập cho từng chủ đề. 

Cuốn sách này sẽ giúp bạn tìm hiểu những điều sau:

  • Lấy mẫu và dữ liệu 
  • Thống kê mô tả 
  • Chủ đề Xác suất và biến ngẫu nhiên 
  • Phân phối bình thường 
  • Định lý giới hạn trung tâm 
  • Khoảng tin cậy 
  • Kiểm định giả thuyết 
  • Phân phối Chi-Square
  • Hồi quy tuyến tính và tương quan 
  • Phân phối F và ANOVA một chiều

Link: Thống kê giới thiệu 2e

Giới thiệu về Thống kê hiện đại là sách giáo khoa trực tuyến miễn phí từ dự án OpenIntro và được viết bởi các tác giả Mine Çetinkaya-Rundel và Johanna Hardin.

Nếu bạn muốn tìm hiểu nền tảng thống kê để phân tích dữ liệu hiệu quả thì cuốn sách này là dành cho bạn. Nội dung của cuốn sách này như sau:

  • Giới thiệu về dữ liệu 
  • Phân tích dữ liệu thăm dò 
  • Mô hình hồi quy 
  • Cơ sở suy luận 
  • suy luận thống kê 
  • Mô hình suy luận

Link: Giới thiệu về Thống kê hiện đại

Suy nghĩ số liệu thống kê của Allen B. Downey sẽ giúp bạn học và thực hành các khái niệm thống kê bằng Python. 

Vì vậy, bạn có thể áp dụng các kỹ năng Python của mình để tìm hiểu các khái niệm thống kê và xác suất để làm việc với dữ liệu một cách hiệu quả. Khi đọc hết cuốn sách, bạn sẽ viết các chương trình Python ngắn và thực hành với các bộ dữ liệu thực để củng cố hiểu biết của mình về các khái niệm thống kê.

Các chủ đề được đề cập như sau:

  • Phân tích dữ liệu thăm dò 
  • phân phát 
  • Hàm khối lượng xác suất 
  • Hàm phân phối tích lũy 
  • Mô hình hóa phân phối 
  • Hàm mật độ xác suất 
  • Mối quan hệ giữa các biến 
  • Ước lượng 
  • Kiểm định giả thuyết 
  • Bình phương nhỏ nhất tuyến tính 
  • Hồi quy 
  • Phân tích sống còn 
  • Phương pháp phân tích

Link: Hãy suy nghĩ số liệu thống kê 2e

Tư duy tính toán và suy luận: Nền tảng của khoa học dữ liệu của Ani Adhikari, John DeNero và David Wagner sẽ giúp bạn tìm hiểu nền tảng thống kê cho khoa học dữ liệu. 

Cuốn sách này được biên soạn như một người bạn đồng hành với Dữ liệu 8: Cơ sở của khoa học dữ liệu khóa học được cung cấp tại UC Berkeley. Các chủ đề được đề cập trong cuốn sách này bao gồm:

  • Giới thiệu về khoa học dữ liệu 
  • Lập trình bằng Python 
  • Kiểu dữ liệu, chuỗi và bảng
  • Hình ảnh
  • Hàm và Bảng
  • Sự ngẫu nhiên 
  • Lấy mẫu và phân phối theo kinh nghiệm 
  • Kiểm định giả thuyết 
  • Ước lượng 
  • Hồi quy 
  • phân loại

Link: Tư duy tính toán và suy luận: Nền tảng của khoa học dữ liệu

Lập trình xác suất và phương pháp Bayesian dành cho tin tặc hay Phương pháp Bayesian dành cho tin tặc là một cuốn sách nổi tiếng về các phương pháp Bayesian trong thống kê.

“Phương pháp Bayesian dành cho tin tặc”: Giới thiệu về phương pháp Bayesian + lập trình xác suất với quan điểm tính toán/hiểu biết trước tiên, toán học thứ hai. Tất cả đều bằng Python thuần túy 😉 

 

nguồn

Bạn sẽ làm quen với lý thuyết xác suất và suy luận Bayes trong khi sử dụng gói PyMC. Nội dung của cuốn sách này như sau:

  • Giới thiệu về phương pháp Bayes
  • Thư viện PyMC
  • Chuỗi Markov Monte Carlo
  • Quy luật số lớn
  • Mất chức năng
  • Trước đó

Link: Lập trình xác suất và phương pháp Bayesian dành cho tin tặc

Tôi hy vọng bạn thấy tổng hợp các cuốn sách thống kê miễn phí này hữu ích. Sự kết hợp giữa lý thuyết và thực hành sẽ giúp bạn nâng cao kỹ năng khoa học dữ liệu và đưa ra quyết định sáng suốt hơn khi làm việc với các tập dữ liệu lớn trong thế giới thực.

Nếu bạn muốn tham gia các khóa học miễn phí hoặc muốn bổ sung các khóa học cho việc đọc của mình, hãy xem 5 khóa học miễn phí để làm chủ thống kê cho khoa học dữ liệu.
 
 

Bala Priya C là một nhà phát triển và nhà văn kỹ thuật đến từ Ấn Độ. Cô ấy thích làm việc ở lĩnh vực giao thoa giữa toán học, lập trình, khoa học dữ liệu và sáng tạo nội dung. Các lĩnh vực chuyên môn và quan tâm của cô bao gồm DevOps, khoa học dữ liệu và xử lý ngôn ngữ tự nhiên. Cô ấy thích đọc, viết, viết mã và cà phê! Hiện tại, cô ấy đang nỗ lực học hỏi và chia sẻ kiến ​​thức của mình với cộng đồng nhà phát triển bằng cách viết các hướng dẫn, hướng dẫn cách thực hiện, các ý kiến, v.v. Bala cũng tạo ra các hướng dẫn viết mã và tổng quan tài nguyên hấp dẫn.

tại chỗ_img

Tin tức mới nhất

tại chỗ_img