Logo Zephyrnet

Kéo và phân tích dữ liệu tài chính bằng gói Python đơn giản

Ngày:

Kéo và phân tích dữ liệu tài chính bằng gói Python đơn giản

Chúng tôi trình diễn một tập lệnh/gói Python đơn giản để giúp bạn lấy dữ liệu tài chính (tất cả các số liệu và tỷ lệ quan trọng mà bạn có thể nghĩ ra) và vẽ biểu đồ chúng.


Giới thiệu

 
Phân tích thị trường chứng khoán và đầu tư tốt (để tăng trưởng dài hạn) đòi hỏi kiểm tra cẩn thận các dữ liệu tài chính. Khác nhau số liệu và tỷ lệ thường được sử dụng trong phân tích như vậy, tức là để đánh giá chất lượng vốn có của cổ phiếu. Bạn có thể đã nghe nói về một số trong số chúng trong buổi nói chuyện từ các chuyên gia tài chính và đầu tư.

Ví dụ, các Tỷ lệ giá trên thu nhập or Tỷ số P / E. Đó là tỷ lệ giữa giá cổ phiếu trên thu nhập/cổ phiếu hàng năm.

Hoặc là Giá trị sổ sách trên mỗi cổ phiếu. Nó lấy tỷ lệ vốn cổ phần phổ thông của một công ty chia cho số lượng cổ phiếu đang lưu hành. Khi một cổ phiếu bị định giá thấp, nó sẽ có giá trị sổ sách trên mỗi cổ phiếu cao hơn so với giá cổ phiếu hiện tại trên thị trường.

 
Đánh giá tương lai của cổ phiếu bằng tỷ lệ giá trên thu nhập và PEG
Tỷ lệ giá trên thu nhập (P/E) là một trong những thước đo được sử dụng rộng rãi nhất để các nhà đầu tư và nhà phân tích xác định cổ phiếu…
 

Thông thường những dữ liệu như vậy có sẵn từ các trang web như Yahoo Finance. Tuy nhiên, trừ khi bạn đang sử dụng một số loại dịch vụ đã đăng ký, trả phí, bạn không thể tải xuống hoặc trích xuất dữ liệu theo chương trình.

 
Yahoo Finance – Trực tiếp thị trường chứng khoán, Báo giá, Tin tức kinh doanh & tài chính
Tại Yahoo Finance, bạn nhận được báo giá cổ phiếu miễn phí, tin tức cập nhật, tài nguyên quản lý danh mục đầu tư, thị trường quốc tế…
 

Tuy nhiên, có nhiều vi dịch vụ cung cấp dữ liệu đó qua lệnh gọi API đơn giản. Để tận dụng lợi thế đó, chúng tôi trình bày, trong bài viết này, cách viết một tập lệnh lớp Python đơn giản để giao tiếp với một dịch vụ vi mô dữ liệu tài chính.

Hình

Nguồn ảnh: Chụp màn hình của tác giả (Website)

Với lớp Python này, bạn có thể lấy dữ liệu và xây dựng Khung dữ liệu Pandas với hầu hết tất cả các chỉ số và tỷ lệ tài chính quan trọng bằng cách gọi một loạt phương pháp đơn giản.

Chúng tôi cũng cung cấp các phương pháp lập biểu đồ đơn giản (biểu đồ thanh và biểu đồ phân tán) để phân tích dữ liệu bằng đồ họa.

Lưu ý rằng bạn cần lấy khóa API bí mật (miễn phí) của riêng mình từ trang web và đăng ký nó sau khi khởi tạo đối tượng lớp.

Như đã nói, chúng ta hãy kiểm tra gói/lớp Python và các phương thức khác nhau đi kèm với nó.

Lớp Python và các phương thức tích hợp khác nhau

 
Lớp Python cốt lõi có sẵn ở đây trên repo Github của tôi. Hãy thoải mái gắn dấu sao và phân nhánh repo và cải thiện nó. Bạn có thể chỉ cần sao chép kho lưu trữ và bắt đầu sử dụng tập lệnh trong Notebook của riêng mình.

> mkdir My_project
> cd My_Project
> git clone https://github.com/tirthajyoti/Finance-with-Python.git
> cd financeAPI  


Để giữ cho mã luôn rõ ràng, trong bài viết này, chúng tôi trình bày cách sử dụng lớp này trong sổ ghi chép Jupyter thử nghiệm.

Chúng tôi bắt đầu bằng cách nhập các thư viện thông thường và đối tượng lớp.

Hình ảnh cho bài viết

Đọc khóa API bí mật từ một tệp và đăng ký nó

 
Lưu ý rằng bạn cần phải có một tập tin có tên Secret_Key.txt trong cùng thư mục với các tập tin mã. Không có nó, bạn không thể tiến bộ.

Đăng ký tại đây: https://financialmodelingprep.com/login

Hình ảnh cho bài viết

Tạo một thể hiện của lớp

 
Hình ảnh cho bài viết

Nó có một mô tả

 
Hình ảnh cho bài viết

Chúng tôi không thể truy cập dữ liệu nếu không đăng ký khóa

 
Chúng tôi chắc chắn muốn bắt đầu lấy dữ liệu ngay bây giờ. Giả sử chúng tôi muốn xây dựng một từ điển dữ liệu cho công ty Apple (với ký hiệu mã 'AAPL'). Chúng ta có thể thử nhưng sẽ không thành công vì chúng ta chưa đăng ký khóa bí mật với đối tượng lớp.

Hình ảnh cho bài viết

Vì vậy, chúng tôi đăng ký khóa bí mật

 
Hình ảnh cho bài viết

Chúng ta hãy xây dựng một từ điển dữ liệu ngay bây giờ

 
Đối với tất cả các phương pháp trong lớp này, chúng ta phải chuyển biểu tượng mã cổ phiếu của công ty (trên thị trường tài chính Hoa Kỳ). Đối với Apple Inc, đó là 'AAPL'.

Hình ảnh cho bài viết

Nếu kiểm tra từ điển này, chúng tôi sẽ lưu ý rằng một lượng lớn dữ liệu đã được lấy từ điểm cuối API. Một phần ảnh chụp màn hình được cung cấp dưới đây.

Hình ảnh cho bài viết

Xây dựng DataFrame với dữ liệu của nhiều công ty

 
Làm việc với từ điển Python cũng được nhưng để phân tích dữ liệu quy mô lớn, chúng ta nên nghĩ đến việc xây dựng Pandas DataFrame. Chúng tôi cung cấp một phương pháp tích hợp để làm việc đó. Việc xây dựng DataFrame dễ dàng như chuyển danh sách các ký hiệu mã báo giá và mã sẽ thực hiện tất cả công việc sắp xếp và cấu trúc dữ liệu cho bạn.

Giả sử chúng tôi muốn tải xuống tất cả dữ liệu tài chính của các công ty sau:

  • Twitter
  • Facebook
  • microsoft
  • Nvidia
  • Apple
  • Salesforce

Hình ảnh cho bài viết

DataFrame được định dạng đẹp mắt đã sẵn sàng để bạn sử dụng!

Hình ảnh cho bài viết

Dù sao thì loại dữ liệu nào cũng có sẵn?

 
Chúng tôi có thể dễ dàng kiểm tra loại dữ liệu được lấy từ dịch vụ API. Lưu ý, chúng tôi chuyển một đối số 'hồ sơ', 'số liệu' hoặc 'khẩu phần' và lấy lại danh sách các mục dữ liệu tương ứng.

Hình ảnh cho bài viết

Hình ảnh cho bài viết

Hình ảnh cho bài viết

Bắt tay vào vẽ đồ thị - phân tích trực quan

 
Trong gói này, chúng tôi đã bao gồm mã để phân tích hình ảnh đơn giản cùng với dữ liệu.

Việc kiểm tra các số liệu và tỷ số tài chính khác nhau trong biểu đồ thanh đơn giản thường rất hữu ích. Để làm điều đó, chỉ cần nhập tên của biến bạn muốn vẽ đồ thị. Bạn cũng có thể bao gồm các đối số từ khóa Matplotlib thông thường như màu sắc và độ trong suốt (alpha).

Hình ảnh cho bài viết

Hình ảnh cho bài viết

Bạn cũng có thể vẽ biểu đồ phân tán đơn giản để phân tích trực quan mối quan hệ giữa các số liệu tài chính.

Hình ảnh cho bài viết

Bạn cũng có thể chuyển vào biến thứ ba được sử dụng để chia tỷ lệ kích thước của điểm đánh dấu trong biểu đồ phân tán. Điều này giúp, theo cách gián tiếp, trực quan hóa nhiều hơn hai biến trong biểu đồ 2 chiều. Ví dụ: chúng tôi chuyển tham số giá cổ phiếu làm biến thứ ba trong mã bên dưới.

Hình ảnh cho bài viết

Phân tích tùy chỉnh với DataFrame cơ bản

 
Thông thường, các nhà đầu tư có thể muốn tạo bộ lọc và logic đầu tư của riêng mình dựa trên dữ liệu có sẵn.

Ví dụ: chúng tôi có thể chỉ muốn xem xét những công ty có vốn hóa thị trường > 200 tỷ USD và sau đó xem xét số liệu về Giá trị doanh nghiệp trên EBIDTA trong biểu đồ thanh.

Chúng ta có thể truy cập DataFrame cơ bản, tạo DataFrame tùy chỉnh và sau đó gán DataFrame tùy chỉnh này cho một DataFrame mới financeAPI() đối tượng để tận dụng các phương pháp biểu đồ được tạo sẵn.

Bằng cách này, chúng tôi sẽ không cần yêu cầu lại dữ liệu từ API. Chúng ta nên tránh đọc dữ liệu càng nhiều càng tốt vì giới hạn số lượng dữ liệu được đọc bằng khóa API miễn phí.

Hình ảnh cho bài viết

Và sau đó chúng tôi vẽ biểu đồ thanh dựa trên DataFrame tùy chỉnh này (được nhúng trong đối tượng lớp tùy chỉnh).

Hình ảnh cho bài viết

Tổng kết

 
Chúng tôi trình bày cách triển khai và sử dụng một lớp/gói Python đơn giản có thể được sử dụng để lấy nhiều chỉ số và tỷ lệ tài chính từ một vi dịch vụ.

Cần phải đăng ký dịch vụ để có được khóa API miễn phí cho việc này. Tất nhiên, việc sử dụng bị giới hạn về số lượng dữ liệu được đọc cho tài khoản miễn phí. Trang web cũng có gói trả phí để sử dụng không giới hạn.

Lưu ý rằng công việc này tập trung vào dữ liệu tài chính tĩnh, như có trong báo cáo tài chính hàng năm chứ không phải trên dữ liệu định giá thị trường cổ phiếu theo chuỗi thời gian động. Nó nên được sử dụng để đánh giá sức mạnh tài chính dài hạn của một công ty để đầu tư theo định hướng tăng trưởng.

Là một nhà khoa học dữ liệu, bạn thường có thể cần phải viết lớp/gói tùy chỉnh để lấy và phân tích dữ liệu từ API microservice và hy vọng bài viết này (và cơ sở mã liên quan) có thể cung cấp cho bạn phần giới thiệu đơn giản nhưng hiệu quả về kiến ​​thức đó.

Ngoài ra, bạn có thể kiểm tra tác giả của GitHub kho cho mã, ý tưởng và tài nguyên trong học máy và khoa học dữ liệu. Nếu bạn cũng như tôi, đam mê AI / máy học / khoa học dữ liệu, xin vui lòng thêm tôi vào LinkedIn or theo dõi tôi trên Twitter.

 
Nguyên. Đăng lại với sự cho phép.

Liên quan:

Nguồn: https://www.kdnuggets.com/2020/07/pull-analyze-financial-data-simple-python-package.html

tại chỗ_img

Tin tức mới nhất

tại chỗ_img