Giới thiệu PandasAI: Thư viện phân tích dữ liệu do GenAI cung cấp
Ngày 19/01/2024 - 09:01Các công ty đang cố gắng tìm cách tận dụng tối đa những đổi mới này, chẳng hạn như ChatGPT . Điều này sẽ giúp bất kỳ doanh nghiệp nào có được lợi thế cạnh tranh. Một cải tiến tiên tiến mới là giới thiệu thư viện phân tích dữ liệu do GenAI cung cấp cho thư viện Pandas thông thường được gọi là “PandasAI”. OpenAI đã làm được điều này. Không giống như các lĩnh vực Generative AI khác, PandasAI áp dụng công nghệ của GenAI vào công cụ phân tích Pandas.
Đúng như tên gọi, nó áp dụng trực tiếp trí tuệ nhân tạo vào thư viện Pandas truyền thống. Thư viện Pandas đã trở nên rất phổ biến trong lĩnh vực dữ liệu với Python trong các tác vụ như tiền xử lý và trực quan hóa dữ liệu, và sự đổi mới này đã khiến nó trở nên tốt hơn.
Sử dụng tài khoản ChatGPT Plus không chỉ giúp bạn có câu trả lời nhanh chóng và chính xác hơn mà còn mở ra nhiều cơ hội sáng tạo trong viết lách, nghiên cứu và lập kế hoạch công việc
Mục tiêu học tập
- Tìm hiểu về PandasAI mới
- Sử dụng PandasAI với truy vấn đàm thoại
- Vẽ đồ thị với PandasAI
- Nhìn vào PandasAI và phần phụ trợ của nó (GenAI)
Bài viết này đã được xuất bản như một phần của Blogathon Khoa học dữ liệu .
PandasAI là gì?
PandasAI là thư viện Python sử dụng các mô hình Generative AI để thực hiện các nhiệm vụ với gấu trúc. Đó là một thư viện tích hợp các khả năng trí tuệ nhân tạo tổng quát bằng cách sử dụng kỹ thuật nhanh chóng để làm cho các khung dữ liệu Pandas có tính trò chuyện. Khi chúng tôi nhớ lại Pandas, nó gợi nhớ đến việc phân tích và thao tác dữ liệu. Với PandasAI, chúng tôi cố gắng cải thiện năng suất của Pandas nhờ lợi ích của GenAI.
Tại sao nên sử dụng PandasAI?
Với sự trợ giúp của Trí tuệ nhân tạo sáng tạo, tất cả chúng ta đều cần đưa ra lời nhắc hội thoại cho tập dữ liệu. Điều này đi kèm với lợi thế là loại bỏ nhu cầu học hoặc hiểu mã phức tạp. Nhà khoa học dữ liệu có thể truy vấn tập dữ liệu bằng cách chỉ cần nói chuyện với tập dữ liệu bằng ngôn ngữ tự nhiên của con người và nhận kết quả. Điều này giúp tiết kiệm thời gian trong quá trình tiền xử lý và phân tích. Đây là cuộc cách mạng mới mà các lập trình viên không cần phải viết mã. Họ chỉ cần nói những gì họ nghĩ trong đầu và xem hướng dẫn của họ được thực hiện. Ngay cả những người không chuyên về công nghệ giờ đây cũng có thể xây dựng hệ thống mà không cần viết bất kỳ mã phức tạp nào!
PandasAI hoạt động như thế nào?
Trước khi tìm hiểu cách sử dụng PandasAI, chúng ta hãy xem nó hoạt động như thế nào. Chúng tôi đã đề cập đến thuật ngữ “Trí tuệ nhân tạo sáng tạo” nhiều lần ở đây. Nó đóng vai trò là công nghệ đằng sau việc triển khai PandasAI. Generative AI (GenAI) tài khoản chat gpt 4 là một tập hợp con của trí tuệ nhân tạo có thể tạo ra nhiều loại dữ liệu, bao gồm văn bản, âm thanh, video, hình ảnh và mô hình 3D. Nó thực hiện điều này bằng cách xác định các mẫu trong dữ liệu đã được thu thập và khai thác chúng để tạo ra các kết quả đầu ra mới và đặc biệt.
Một điều cần lưu ý là sử dụng các mô hình ngôn ngữ lớn (LLM). PandasAI đã được đào tạo về LLM là các mô hình bao gồm mạng nơ-ron nhân tạo (ANN) với nhiều tham số (hàng chục triệu đến thậm chí hàng tỷ). Tất cả điều này giúp mô hình đằng sau PandasAI có thể nhận hướng dẫn của con người và mã hóa chúng trước khi diễn giải. PandasAi cũng đã được thiết kế để xử lý các mô hình LangChain, giúp việc xây dựng các ứng dụng LLM trở nên dễ dàng hơn.
Bắt đầu với Pandas AI
Bây giờ chúng ta hãy xem cách sử dụng PandasAI. Chúng ta sẽ thấy hai cách tiếp cận để sử dụng PandasAI. Đầu tiên là sử dụng các mô hình LangChain và sau đó là triển khai trực tiếp.
Sử dụng mô hình LangChain
Để sử dụng các mô hình LangChain, trước tiên bạn cần cài đặt gói Langchain:
Sau đó chúng ta có thể khởi tạo một đối tượng LangChain:
Môi trường của bạn hiện đã sẵn sàng và PandasAI sẽ tự động sử dụng llm LangChain và chuyển đổi nó thành llm PandasAI.
Triển khai trực tiếp (Không có LangChain)
Bài viết này sử dụng phương pháp thứ hai bằng cách cài đặt PandasAI mà không sử dụng LangChain. Khi viết bài này, Colab không cài đặt sẵn PandasAI như Pandas. Đây là lý do tại sao chúng ta cần bắt đầu bằng cách cài đặt nó.
Một điều quan trọng khác cần lưu ý là bạn cần có khóa API OpenAI để sử dụng PandaAI. Khóa API có thể được tạo bằng tài khoản trên nền tảng OpenAI. Hãy truy cập vào đây để tạo chìa khóa.
Hãy nhớ giữ chìa khóa an toàn để sử dụng sau này, vì việc quay lại trang web sẽ không cấp cho bạn quyền truy cập để sao chép khóa. Tôi cũng ẩn khóa API của mình khỏi công chúng để quản lý tín dụng của mình. Làm tương tự!
Lưu ý: Với tài khoản OpenAI miễn phí, bạn có thể không vẽ được biểu đồ bằng PandasAI một cách thuận tiện do hạn chế 3 lời nhắc mỗi phút. Điều này nhằm quản lý nhu cầu cao của hệ thống và giữ cho nó ở mức tối đa.
XEM THÊM: Tài khoản Chat GPT 4 với giá trải nghiệm!
Nhập phụ thuộc
Hãy để chúng tôi tiếp tục bằng cách nhập các phần phụ thuộc của chúng tôi.
Tiếp theo, chúng tôi nhập OpenAI từ Pandasai mà chúng tôi đã cài đặt trước đó. Đảm bảo chèn khóa API của bạn bằng cách thay thế INSERT_YOUR_API_KEY_HERE trước khi chạy mã, như hiển thị bên dưới.
Truy vấn đàm thoại
Bây giờ chúng ta hãy xem một số lời nhắc văn bản trên tập dữ liệu mống mắt.
ví dụ 1
nhắc='Loài nào phổ biến nhất?'
Ví dụ 2
nhắc='Độ dài trung bình của sepal_length là bao nhiêu?'
Ví dụ 3
nhắc='Trung bình của sepal_width là bao nhiêu?'
Ví dụ 4
nhắc='Chiều dài cánh hoa nào phổ biến nhất?'
Vẽ đồ thị với PandasAI
Vâng, chúng tôi không chỉ có thể tạo ra văn bản! Chúng tôi cũng có thể tạo sơ đồ và đồ thị bằng PandasAI. Điều này sẽ yêu cầu Khóa API phải trả phí, nếu không, nó có thể sẽ tạo ra RateLimitError . Thỉnh thoảng bạn có thể thử chạy lời nhắc của mình. Trong khoảng thời gian 20 giây hoặc đơn giản là bạn có thể nhận gói trả phí.
Xử lý lỗi RateLimitError trong PandasAI
Bạn có thể gặp phải RateLimitError khi bắt đầu tạo biểu đồ hoặc đồ thị. Những người sử dụng khóa API miễn phí sẽ gặp phải điều này. Một lối thoát đầu tiên là có được một gói trả phí. Điều này mang lại cho bạn nhiều tín dụng và nguồn lực hơn để thực hiện các nhiệm vụ đòi hỏi khắt khe. Nhưng nếu bạn chỉ muốn thử nghiệm hoặc chỉ có quyền truy cập vào Khóa miễn phí, bạn phải điều chỉnh cách chạy mã của mình theo cách thủ công. Bạn dự kiến chỉ chạy các lời nhắc giới hạn với tài khoản miễn phí với khoảng thời gian khoảng 20 giây giữa các lời nhắc. Điều này cho phép bạn chạy mã của mình trong khoảng thời gian 20 giây. Điều này nhằm quản lý máy chủ giữa những người dùng do nhu cầu cao.
ví dụ 1
Nhắc = '"Vẽ biểu đồ của các mục."
Ví dụ 2
Nhắc = 'Thực hiện biểu đồ phân tán của sepal_length và sepal_width'
Ví dụ 3
Nhắc = “Vẽ sơ đồ rải rác gồm sepal_length và sepal_width cho loài'
Các khả năng tiếp tục tăng lên. Bạn có thể thử các lệnh của mình và xem nó diễn ra như thế nào. Mục tiêu là gặt hái những lợi ích đi kèm với trí tuệ nhân tạo Sáng tạo.
Phần kết luận
Chúng tôi đã thấy rằng bằng cách sử dụng các mô hình ngôn ngữ lớn để trích xuất thông tin chi tiết từ bộ dữ liệu, Pandas AI có khả năng biến đổi hoạt động phân tích dữ liệu. Tuy nhiên, nó bị hạn chế và cần sự xác minh của con người để đảm bảo độ chính xác. Vấn đề này có thể được giải quyết bằng cách học kỹ thuật nhanh chóng. Vì vậy, chúng ta có thể kết luận bằng cách nói PandasAI là Pandas + AI. Cụ thể hơn có thể nói là Pandas + Generative AI. Tất cả điều này có thể thực hiện được bằng cách sử dụng các lệnh, cho phép người dùng tương tác với các tác vụ theo cách giữa người với người. Lời nhắc được xử lý bằng NLP nâng cao và kết hợp nó với các nhiệm vụ khác.
Bài học chính
- Những tiến bộ của AI trong sáng tạo làm gián đoạn dữ liệu, dẫn dắt các công ty khám phá các giải pháp đổi mới như ChatGPT và PandasAI, cải thiện khả năng phân tích và trực quan hóa dữ liệu.
- PandasAI là thư viện Python vận hành các mô hình Generative AI để nâng cao năng suất của Pandas bằng cách cải thiện khả năng phân tích và thao tác dữ liệu, sử dụng kỹ thuật nhanh chóng và khả năng GenAI.
- AI sáng tạo giúp tiết kiệm thời gian và cho phép xây dựng hệ thống phi kỹ thuật thông qua các lệnh đàm thoại.
Câu hỏi thường gặp (FAQ)
A. Kỹ thuật nhắc nhở liên quan đến việc tạo ra các hướng dẫn (truy vấn) theo ngữ cảnh cụ thể để tạo ra phản hồi mong muốn từ các mô hình ngôn ngữ. Những cuộc trò chuyện này hướng dẫn mô hình và định hình hành vi cũng như đầu ra của nó.
A. Trí tuệ nhân tạo tổng quát hoặc AI tổng quát là hệ thống trí tuệ nhân tạo (AI) có khả năng tạo ra văn bản, hình ảnh hoặc phương tiện khác để đáp ứng các lệnh.
A. Một số ví dụ về PE là hệ thống AI, chẳng hạn như Pandas AI và ChatGPT.
A. Mặc dù Generative AI đã đạt được nhiều thành tựu gần đây nhưng nó vẫn gặp phải một số nhược điểm, chẳng hạn như đạo đức, kiểm soát nội dung có hại, vấn đề bản quyền, quyền riêng tư dữ liệu, v.v.
Bài viết liên quan
21/02/2024
21/01/2024
04/02/2024
19/01/2024
26/01/2024
19/01/2024