Skip to content

Feature/46 retrieve성능 향상 #76

New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Merged
merged 3 commits into from
Apr 29, 2025
Merged

Conversation

ehddnr301
Copy link
Collaborator

#️⃣ Issue Number

📝 요약(Summary)

image

  • retrieve 할때 reranking을 쓸수 있도록 streamlit에 selectbox를 추가했습니다.
  • 찾을 테이블 갯수도 streamlit에서 조정하도록 추가하였습니다.
  • reranking시 Dongjin-kr/ko-reranker 모델을 통해 reranking 합니다.
    • 한국어로 description이 적혀있다는 가정 (추후 Optional하게 변경해도 괜찮겠네요)
  • 테이블을 찾는 부분을 retrieval.py 로 분리했습니다.
  • graph 순서를 아래와 같이 변경했습니다.
      1. 기존: QUERY_REFINER -> 현재: GET_TABLE_INFO
      1. 기존: GET_TABLE_INFO -> 현재: QUERY_REFINER
      1. QUERY_MAKER
  • 이유는 회사에 적용했을때 유저질문을 재정의한 이후에 테이블을 찾으니 유저 입력과 관계없는 테이블이 너무 많이 찾아지는것을 경험하였습니다.
    • 입력: 특정 서비스 분석
    • 재정의: 유저 접속과 매출을 고려하여 ~~~
    • 결과: 특정 서비스 관련 테이블이 나오는게 아니라 유저 접속이나 매출테이블들이 먼저 검색됨

💬 To Reviewers (선택)

  • 순서 변경에 대해 피드백 부탁드립니다!

PR Checklist

  • lang2sql --datahub_server http://34.125.222.80:8080 run-streamlit

reference) How to Code Review

  • 따봉(👍): 리뷰어가 리뷰이의 코드에서 칭찬의 의견을 남기고 싶을 때 사용합니다.
  • 느낌표(❗): 리뷰어가 리뷰이에게 필수적으로 코드 수정을 요청할 때 사용합니다.
  • 물음표 (❓): 리뷰어가 리뷰이에게 의견을 물어보고 싶을 때 사용합니다.
  • 알약 (💊): 리뷰어가 리뷰이의 코드에서 개선된 방법을 제안하지만 그것의 반영이 필수까지는 아닐 때 사용합니다.

Copy link
Contributor

@ParkGyeongTae ParkGyeongTae left a comment

Choose a reason for hiding this comment

The reason will be displayed to describe this comment to others. Learn more.

👍 오... 찾는 테이블 갯수를 조정하는게 확실히 흥미롭네여

@nonegom nonegom merged commit bb81236 into master Apr 29, 2025
1 check passed
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
None yet
Projects
None yet
Development

Successfully merging this pull request may close these issues.

3 participants