Logo Zephyrnet

Nửa đầu năm 2023: Khoa học dữ liệu và phát triển AI – KDnuggets

Ngày:

Nửa đầu năm 2023: Khoa học dữ liệu và phát triển AI
Photo by Tara Winstead
 

Rất nhiều điều đã xảy ra trong nửa đầu năm 2023. Đã có những tiến bộ đáng kể trong khoa học dữ liệu và trí tuệ nhân tạo. Nhiều đến mức thật khó để chúng tôi theo kịp tất cả. Có thể khẳng định chắc chắn rằng nửa đầu năm 2023 đã cho thấy những bước tiến nhanh chóng mà chúng tôi không ngờ tới. 

Vì vậy, thay vì nói quá nhiều về việc tất cả chúng ta bị thu hút bởi những đổi mới này như thế nào, hãy nói về chúng.

Tôi sẽ bắt đầu với điều rõ ràng nhất. Xử lý ngôn ngữ tự nhiên (NLP). Một cái gì đó đang được xây dựng trong bóng tối, và vào năm 2023 đã được đưa ra ánh sáng. 

Những tiến bộ này đã được chứng minh trong OpenAI's ChatGPT, đã gây bão trên toàn thế giới. Kể từ khi phát hành chính thức vào đầu năm, ChatGPT đã chuyển từ GPT-4 và hiện chúng tôi đang mong chờ GPT-5. Họ đã phát hành bổ sung để cải thiện cuộc sống hàng ngày của mọi người và quy trình làm việc cho nhà khoa học dữ liệukỹ sư học máy

Và chúng ta đều biết sau khi ChatGPT phát hành, Google đã phát hành thi sĩ AI đã được chứng minh là thành công giữa mọi người, doanh nghiệp, v.v. Bard AI đã cạnh tranh với ChatGPT để giành vị trí chatbot tốt nhất, cung cấp các dịch vụ tương tự như cải thiện nhiệm vụ cho kỹ sư học máy

Trong quá trình phát hành các chatbot này, chúng tôi đã thấy mô hình ngôn ngữ lớn (LLM) thả ra khỏi không khí mỏng. Tổ chức hệ thống mô hình lớn (LMSYS Org), một tổ chức nghiên cứu mở được thành lập bởi các sinh viên và giảng viên từ UC Berkeley đã tạo ra Đấu trường ChatBot – một điểm chuẩn LLM để làm cho mọi người có thể tiếp cận các mô hình dễ dàng hơn bằng cách sử dụng phương pháp đồng phát triển bằng cách sử dụng các bộ dữ liệu, mô hình, hệ thống và công cụ đánh giá mở.

Vì vậy, bây giờ mọi người đã quen với chatbot trả lời câu hỏi cho họ và làm cho công việc cũng như cuộc sống cá nhân của họ dễ dàng hơn nhiều – còn các nhà phân tích dữ liệu và chuyên gia học máy thì sao? 

Vâng, họ đã được sử dụng Tự động – một công cụ mạnh mẽ dành cho các chuyên gia dữ liệu như nhà khoa học dữ liệu và kỹ sư máy học để tự động hóa quá trình tiền xử lý dữ liệu, điều chỉnh siêu tham số và thực hiện các tác vụ phức tạp như kỹ thuật tính năng. Với những tiến bộ trong khoa học dữ liệu và AI, đương nhiên chúng ta nhận thấy nhu cầu cao đối với các chuyên gia về dữ liệu và AI. Tuy nhiên, khi tiến độ đang diễn ra với tốc độ nhanh chóng, chúng ta đang nhận thấy sự thiếu hụt các chuyên gia AI này. Do đó, việc có thể tìm cách khám phá, phân tích và dự đoán dữ liệu trong một quy trình tự động sẽ cải thiện thành công của rất nhiều công ty. 

Nó không chỉ có thể giải phóng thời gian cho các chuyên gia dữ liệu mà các tổ chức sẽ có nhiều thời gian hơn để mở rộng và sáng tạo hơn trong các nhiệm vụ khác. 

Nếu bạn đang chứng kiến ​​sự bùng nổ của chatbot, bạn sẽ thấy dòng chữ 'AI sáng tạo' được ném xung quanh. Trí tuệ nhân tạo có khả năng tạo văn bản, hình ảnh hoặc các dạng phương tiện khác dựa trên lời nhắc của người dùng. Cũng giống như những tiến bộ ở trên, AI tổng quát đang hỗ trợ các ngành công nghiệp khác nhau thực hiện các nhiệm vụ giúp cuộc sống của họ trở nên dễ dàng hơn. 

Nó có khả năng tạo nội dung mới, thay thế các tác vụ lặp đi lặp lại, hoạt động trên dữ liệu tùy chỉnh và hầu như tạo ra bất kỳ thứ gì bạn muốn. Nếu AI tổng quát là mới đối với bạn, bạn sẽ muốn tìm hiểu về Khuếch tán ổn định – đó là nền tảng đằng sau AI tổng quát. Nếu bạn là nhà khoa học dữ liệu hoặc nhà phân tích dữ liệu, bạn có thể đã nghe nói về gấu trúcAI – thư viện python AI tổng quát, nếu không muốn nói là bộ công cụ nguồn mở tích hợp các khả năng AI tổng quát vào Pandas để phân tích dữ liệu đơn giản hơn. 

Nhưng với những công cụ và phần mềm AI tổng quát này được phát hành, Các nhà khoa học dữ liệu có còn cần thiết trong thời đại AI sáng tạo không?

Học kĩ càng đang tiếp tục phát triển mạnh. Với những tiến bộ gần đây trong khoa học dữ liệu và AI, nhiều thời gian và năng lượng hơn đang được đổ vào nghiên cứu của ngành. Là một tập hợp con của học máy liên quan đến các thuật toán và mạng thần kinh nhân tạo, nó được sử dụng rộng rãi trong các tác vụ như phân loại hình ảnh, phát hiện đối tượng và nhận dạng khuôn mặt. 

Khi chúng ta đang trải qua cuộc cách mạng công nghiệp lần thứ 4, các thuật toán học sâu đang cho phép chúng ta học hỏi từ dữ liệu giống như cách con người làm. Chúng ta đang thấy nhiều xe tự lái hơn trên đường, các công cụ phát hiện gian lận, trợ lý ảo, mô hình dự đoán chăm sóc sức khỏe, v.v. 

Năm 2023 đã chứng tỏ hiệu quả của học sâu thông qua các quy trình tự động, người máy, chuỗi khối và nhiều công nghệ khác.

Với tất cả những gì đang xảy ra, bạn phải nghĩ rằng những chiếc máy tính này khá mệt mỏi phải không? Để đáp ứng những tiến bộ của AI và khoa học dữ liệu, các công ty yêu cầu máy tính và hệ thống có thể giúp hỗ trợ họ. Điện toán biên mang tính toán và lưu trữ dữ liệu đến gần hơn với các nguồn dữ liệu. Khi làm việc với các mô hình tiên tiến này, điện toán biên cung cấp khả năng xử lý dữ liệu theo thời gian thực và cho phép giao tiếp thông suốt giữa tất cả các thiết bị.

Ví dụ: khi các LLM được phát hành cứ sau hai giây, rõ ràng là các tổ chức sẽ yêu cầu các hệ thống hiệu quả như điện toán cạnh để thành công. Google phát hành TPU v4 năm nay – tài nguyên máy tính có thể đáp ứng nhu cầu tính toán cao của học máy và trí tuệ nhân tạo.

Do những tiến bộ này, chúng ta đang chứng kiến ​​nhiều tổ chức chuyển từ đám mây đến cạnh để phù hợp với yêu cầu hiện tại và tương lai của họ. 

Rất nhiều điều đã xảy ra, và nó đã xảy ra trong một khoảng thời gian ngắn. Nó trở nên rất khó khăn cho các tổ chức như chính phủ để theo kịp. Các chính phủ trên khắp thế giới đang đặt ra câu hỏi 'những ứng dụng AI này ảnh hưởng như thế nào đến nền kinh tế và xã hội, và những tác động là gì?'. 

Mọi người lo ngại về sự thiên vị và phân biệt đối xử, quyền riêng tư, tính minh bạch và tính bảo mật của các ứng dụng khoa học dữ liệu và AI này. Vì vậy, những gì là khía cạnh đạo đức của AI và khoa học dữ liệu, và chúng ta nên mong đợi điều gì trong tương lai?

Chúng tôi đã có Đạo luật AI châu Âu thúc đẩy một khuôn khổ nhóm các hệ thống AI thành 4 lĩnh vực rủi ro. mởAI Giám đốc điều hành Sam Altman làm chứng về những lo ngại và cạm bẫy có thể có của công nghệ mới tại một ủy ban của Thượng viện Hoa Kỳ vào thứ Ba ngày 16. Mặc dù có rất nhiều tiến bộ xảy ra trong một khoảng thời gian ngắn, nhưng rất nhiều người lo ngại. Trong 6 tháng tới, chúng ta có thể mong đợi thêm một số luật được thông qua và các quy định cũng như khuôn khổ sẽ được áp dụng. 

Nếu bạn không theo kịp AI và khoa học dữ liệu trong 6 tháng qua, tôi hy vọng bài viết này đã cung cấp cho bạn thông tin chi tiết nhanh về những gì đang diễn ra. Sẽ rất thú vị để xem trong 6 tháng tới những tiến bộ này được chấp nhận như thế nào trong khi vẫn có thể đảm bảo việc sử dụng những công nghệ này có trách nhiệm và đạo đức.
 
 
Nisha Arya là Nhà khoa học dữ liệu, Nhà văn kỹ thuật tự do và Quản lý cộng đồng tại KDnuggets. Cô ấy đặc biệt quan tâm đến việc cung cấp lời khuyên hoặc hướng dẫn về nghề nghiệp Khoa học dữ liệu và kiến ​​thức dựa trên lý thuyết về Khoa học dữ liệu. Cô ấy cũng mong muốn khám phá những cách khác nhau mà Trí tuệ nhân tạo có thể mang lại lợi ích cho tuổi thọ con người. Một người ham học hỏi, tìm cách mở rộng kiến ​​thức công nghệ và kỹ năng viết của mình, đồng thời giúp hướng dẫn người khác.
 

tại chỗ_img

Tin tức mới nhất

tại chỗ_img