2024년 7월 12일 금요일

pandas AI 이용한 표 형식 데이터 생성AI로 처리해 보기

이 글은 pandas AI 이용한 표 형식 데이터 생성AI로 처리해 보는 방법을 간략히 정리한다.

설치는 다음과 같다. 
pip install pandasai

표에서 정보를 질의하고 생성하는 코드는 다음과 같다. 
import os
import pandas as pd
from pandasai import Agent

sales_by_country = pd.DataFrame({
    "country": ["United States", "United Kingdom", "France", "Germany", "Italy", "Spain", "Canada", "Australia", "Japan", "China"],
    "revenue": [5000, 3200, 2900, 4100, 2300, 2100, 2500, 2600, 4500, 7000]
})

in your .env file)
os.environ["PANDASAI_API_KEY"] = "<input your key>"

agent = Agent(sales_by_country)
answer = agent.chat('Which are the top 5 countries by sales?')
print(answer)

결과는 다음과 같다.

표 형식 데이터에서 간단히 필요한 데이터를 질의할 수 있다는 것을 확인할 수 있다. 요즘 PDF에 포함된 표는 OCR 라이브러리로 쉽게 행렬을 추출할 수 있으므로, LangGraph 등을 이용해 다중 에이전트 방식으로 ChatGPT4o와 같은 LLM을 개발할 수 있다는 것을 알 수 있다.

레퍼런스

댓글 없음:

댓글 쓰기