AI 전문가가 되고싶은 사람
[KT 에이블스쿨 기자단] 23주차 회고 본문
23주차 회고를 시작해보겠다.. AI 기능 개발이 완료되었다고 생각했으나, 실제로는 연결 과정에서 입력과 출력 형식을 조정해야 한다는 것을 알게 되었고, 이를 해결하기 위해 파이프라인을 구축하는 일을 시작으로 ppt에 붙어서 열심히 작업을 하였다.
1. 요약 모델 (하이퍼파라미터 조정)
mt5-small 모델의 하이퍼파라미터를 조정해서 어떻게 했을 때 잘 나오는지를 고민하고 확정하였다. 자소서는 보통 500~1000자의 텍스트가 들어가게 되는데 min_length와 max_length를 너무 낮게 두면 자소서 내용이 많이 소실되기 때문에 150이상 500자 이하로 설정해두었다. 앞서 언급한 내용과 마찬가지로 내용 소실을 막기 위해 length_penalty도 디폴트 값보다 높게 두어 더 길게 생성하게 설정하였고, 길게 요약을 시키다보니 같은 내용을 반복하는 경우가 있어서 no_repeat_ngram_size를 2~3으로 두어서 반복 되지 않게 해주었으며, num_beams 값을 8로 두어서 여러 시퀀스에서 생성된 결과 중 제일 나은 요약본을 가져오게 설정해두었다. 모델의 크기가 크다보니 한번의 실행에 시간이 오래 걸려서 손으로 하이퍼파라미터를 조정하였다.
2. 멘토 추천 시스템 ( json 형식으로 출력 값 뽑기 )
우리가 서비스하는 웹페이지에서 직원 정보를 끌어와서 아래와 같이 답변을 하는 것이기 때문에 ID 값을 아웃풋으로 출력해주면 그 id 값으로 프로필을 다른 사람에게 제공하면 되겠다! 라고 생각하였고 ID 값을 추출하기 위한 함수를 작성하였다. 이 후에 추천 이유, 점수, 점수가 5점이 아닌 이유도 뽑아내기 위해서 각 항목 뒤에 오는 텍스트들을 나눠서 list에 저장하였다. 이 과정에서 llm 모델의 답변이 항상 똑같지 않기 때문에 프롬프트를 설정하여 추천 이유, 점수, 점수가 5점이 아닌 이유로 각각 대답하라고 하여 같은 답변이 나오게 하였다.
3. 챗봇 ( 하이퍼파라미터 약간 조정 )
여러 형식의 문서가 들어올 때 기존에는 chunk_size = 500, overlap = 200 이런식으로 잘라냈는데, 청크 사이즈 관련 여러 검색을 해보던 와중에 청크 사이즈 기준으로 10%로 설정하면 좋다!라는 글을 보고나서 chunk_size= 1000, overlap = 100으로 바꾸어 주었다.
4. PPT + 웹 디자인
내가 제일 못하는게 꾸미고, 가시성 좋게 만드는것이다.. 그래서 ppt 템플릿을 어쩌고 뭐 이렇고 저렇고 이런건 고려하지않고, 내용적으로 모든 것을 담아내보려고 했다. 먼저 AI 부분을 작성하였고, 추후에 프론트엔드와 백엔드팀에게 질문하고 이해하며 PPT에 필요한 내용들을 작성하였다. 아래 이미지는 우리 서비스의 마크를 디자인 해본 것이다. 이런 실력을 가지고 있는 나에게 디자인은 너무 어려운 일이였다...
프론트엔드에 계시는 ㄱㅁㅈ님의 디자인을 계속 보다보니 대충 이런 느낌?? 이라고 생각이 들어서 아래와 같이 그나마 나아진 것 같다!!
5. 이번 주 후기
내가 실제로 회사에 취업하게 되어서 프로젝트를 진행하게 되면 이런 일들을 하게 될까?? 라는 생각이 들었다. 다른 부서와 협업이 중요하다!! 라고 말만 들어봤었지만 직접 해보니 중요하다!! 의사소통이 매우 중요하고 이러한 경험이 나중에 큰 도움이 될 것 같았다. 부족한 부분들이 많이 보였기에 이걸 보충해나가면 나도 어딘가에 취업할 수 있지 않을까?? 이 경험을 자소서에 잘 녹여야겠다.
'기자단 활동' 카테고리의 다른 글
[KT 에이블스쿨 기자단] 25주차 회고 (3) | 2024.08.05 |
---|---|
[KT 에이블스쿨 기자단] 24주차 회고 (0) | 2024.07.29 |
[KT 에이블스쿨 기자단] 22주차 회고 (0) | 2024.07.28 |
[KT 에이블스쿨 기자단] 21주차 회고 (0) | 2024.07.28 |
[KT 에이블스쿨 기자단] 20주차 회고 (0) | 2024.07.07 |