Notice
Recent Posts
Recent Comments
Link
12-24 15:36
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Archives
Today
Total
관리 메뉴

AI 전문가가 되고싶은 사람

[KT 에이블스쿨 기자단] 22주차 회고 본문

기자단 활동

[KT 에이블스쿨 기자단] 22주차 회고

Kimseungwoo0407 2024. 7. 28. 01:39

22주차 회고를 시작해보겠다.. 저번 주에 말은 안했지만 코치님께서 AI 팀은 분발해야겠네요. 모델을 얼른 끝내야 기능 추가가 가능하니까 힘내봅시다!! 라고 말씀하셨다. 뭔가를 열심히 공부하고 노력하고있지만 실패를 하고있던 와중에 그런 얘기를 들어서 같은 팀원분은 매우 좌절하셨다 내가 지금 하는게 팀에 도움이 되는건가.. 그래서 이번 주에 진짜 열심히 AI팀이 갈아넣은 것을 리뷰해보겠다.

 

1. 자소서 기술 뽑아내기

아래 이미지와 같이 자기소개서 텍스트가 들어오면 지원자가 가지고 있는 기술과 어떤 직종에 어울리는 자기소개서인지를 뽑아내보았다. 처음에는 openai gpt api로 자소서 내용을 다 넣고 기술이랑 직종 뽑아줘 라고 했었는데 매번 다른 답변이 나오거나 몇개의 기술이 뽑히지 않는 경우가 잦았다. 그래서 해결책으로 잡코리아 세부 직종 부분을 크롤링 해와서 세부 직종 데이터와 겹치는 기술과 직종을 뽑아와달라고 프롬프트를 설정했더니 아래와 같이 매우 똑똑해졌다. 

 

2. 자소서 오탈자 확인

아래와 같이 텍스트가 입력될 시에 틀린 부분을 찾아주고 수정해주는 모델도 구축하였다. 해당 모델은 라벨링이 되어 0,1,2,3,4로 나오게되는데 이를 번호별로 라벨링을 하여서 더 찾기 쉽게 만들어주었다.

 

3. 자소서 요약

같은 자소서에 대해서 textrank와 파인튜닝한 mt5-small 모델을 비교해봤을 때 모든 지표에서 파인튜닝한 모델이 더 높게 나온 것을 알 수 있다.

4. 멘토 매칭

멘토 매칭의 경우 저번주와 마찬가지로 동일하고 프롬프트를 수정하여 같은 질문에 같은 답변이 나올 수 있게 하였다.

 

5. 챗봇

챗봇의 경우 기존에 pdf만 지원했으나 다른 형식의 문서가 들어와도 읽을 수 있게 하였고, 청크 사이즈나 overlap 파라미터를 통해서 더 나은 답변을 이끌어낼 수 있도록 조정하였다. 또한 여러 문서를 한번에 넣고 청크로 자르게 되면 답변이 부정확하고 속도가 느리다는 것을 보완하기 위해서 폴더 이름을 카테고리로 정하여 카테고리를 선택 후 질문하면 폴더 내에 있는 문서를 기반으로 답변을 하게 하였고 이는 더욱 정확하고 빠르게 답변을 얻어내는 결과를 만들었다.

 

6. 이번주 후기

신나게 내가 했던 일들을 기록해보았다. 다음 주도 열심히 달려보겠다. 해당 발표를 하고나서 코치님이 이를 갈고 하셨군요!!라고 하셔서 매우 기분 좋은 한 주였다. 하하