Notice
Recent Posts
Recent Comments
Link
12-20 02:58
«   2024/12   »
1 2 3 4 5 6 7
8 9 10 11 12 13 14
15 16 17 18 19 20 21
22 23 24 25 26 27 28
29 30 31
Archives
Today
Total
관리 메뉴

AI 전문가가 되고싶은 사람

[KT 에이블스쿨 기자단] 20주차 회고 본문

기자단 활동

[KT 에이블스쿨 기자단] 20주차 회고

Kimseungwoo0407 2024. 7. 7. 22:46

이번 20주차에는 19주차와 마찬가지로 타당성 검토를 하였다. 19 주차에는 Weekly scrum만 제출했지만, 20주차에는 모델 정의서와 데이터 정의서를 작성하여 제출하였다. 이제 본격적으로 시작하는 느낌이 들어서 열심히 노력 중이다.

 

1~2일 - 모델링, 크롤링

저번 주에서 말했듯 새로운 기능들을 추가하게 되어서 모델 선택부터 다시 시작하였다. 사용할 모델들을 찾아보면서 이건 되고 이건 안되고 또 분류를 해서 다른 조원분들에게도 공유를 하였다. 아래는 제외한 기능들이다. AI 면접 같은 경우에 아래와 같이 오디오를 녹취해서 녹취본을 토대로 텍스트화, 감정분류한 뒤에 요약본을 만들 예정이였고 여러 고민들을 해보았지만 코치님께서 다른 조가 AI 면접 자체를 주제로 잡아서 한다는 말씀을 해주셔서 그러면 과감히 버려버리자라고 하였다. AI 이력서 판단의 경우에는 자소서를 하나하나 읽고 합격 불합격을 판단하기에 어려움이 있기에 자소서 내용에서 중요한 부분들을 키워드 추출해서 여러 파생 변수들을 생성한 뒤에 모델을 돌려서 임계값보다 높으면 합격 아니면 불합격을 해보려고 했지만 불합격 자소서 데이터가 없어서 이상 탐지 모델을 찾아보아야겠다라고 생각을 했다.

이상 탐지 모델을 찾아서 구축할 수 있겠구나!! 싶었지만 자소서에서 핵심 키워드를 추출하는 과정에서 문제점이 많았다. 자소서 자체에 동일한 단어를 많이 사용하지 않고, 경험을 얘기할 때 분야가 마구마구 섞여서 그런지 textrank를 통한 키워드 추출을 해봤을 때 그렇게 유의미한 결과가 나오지 않았다. 그 외에도 LDA를 사용해서 주제를 추출해봤을 때도 마찬가지였다....

 

위와 같은 과정을 시도할 때 잡코리아 합격 자소서들을 크롤링하였고, 약 6,000개의 데이터를 얻을 수 있었다. 이 데이터를 활용하여 우리 플랫폼의 다른 기능을 할 수 있는 자소서 요약 모델을 만들어보자라고 생각을 하였고, 합격 자소서 데이터로 mT5 모델을 파인튜닝시켜서 내 huggingface에 저장해두었다. 사실상 모델링 파트 한가지 기능은 완성!!

아래 사진은 자소서 질문에 대한 대답을 요약한 것이다.

 

3일차 - 코칭 시간

우리가 준비했던 부분들을 코치님께 말씀드렸더니 이대로만 진행하면 완성시킬 수 있을 것이라고 하셨다. 잘 진행하고 있나보다라는 생각이 많이 들었었다. 다음 주 금요일까지 프론트랑 백 연결시켜서 어느정도 기능 구현해보는게 어떠냐고 조언해주셨다. 추가로 이전까지 웹 개발 부분에서만 기술 코칭이 가능했다면 모델링 부분도 기술 코칭 받을 수 있다고 하시며 필요한 부분들은 최대한 물어보라고 말씀해주셨다. 그래서 3일차 코칭 시간 이후에는 어떤 질문을 할지에 대해서 고민을 하면서 보냈다. 아래는 AI팀 발표를 할 때 썼던 자료이다.

 

4일차 - 노량진에서 대면

4일차에는 노량진에서 대면을 하기로 하고 스터디룸을 1시부터 6시까지 예약해두었다. 오전 시간이 꽉 차버려서 노량진역 스타벅스에서 빅프로젝트를 시작하였다. 오전에는 내가 속한 AI 모델링 팀은 간단한 결과를 뽑아내어 다른 팀원분들에게 공유하며 피드백을 받았고, 프론트 팀은 디자인한 UI를 바탕으로 어떻게 하면 좋을지 의논을 하였고, 백엔드 팀은 채팅방 구현을 하였다. 그 후에 근처 국밥집에서 한그릇 먹고 스터디룸에서는 전체적인 기능들을 더더욱 구체화하였다. 챗봇을 활용해서 할 수 있는 기능들이 매우 많아서 분산시켜서 챗봇을 덜 사용하는 방법이 뭐가 있을까 의논을 많이 하였다. 확실히 대면을 해서 얘기를 자주 나누는 것이 빅프로젝트에 도움이 되는 것 같다. 끝나고 조원분들과 맛있는 닭갈비를 먹고 회에 소주까지 먹었다. 술에 취한 나머지 계단에서 넘어져서 팔이 1.5배가 되버렸고 노트북에는 또 물이 들어가서 화면이 고장나게 되었다... 수리비가 20~30만원이 들고 넘어지는 과정을 다 지켜봐주신 다른 분들에게 창피했지만 이 또한 추억이라고 생각하고 웃으며 4일차를 마무리했다.

 

5일차 - AICE 결과 발표, Weekly scrum 및 데이터, 모델 정의서 작성

5일차에는 사용하는 모델과 데이터에 대해서 정의서를 작성하고 이번 주에는 무엇을 했는지 Weekly scrum을 작성하였다. 주제 정의서도 추가로 작성해서 제출해달라고 하셔서 조원분들과 열심히 작성해서 제출을 완료하였다. AICE 자격 시험은 합격을 하였다. 80점 이상 맞으면 합격이라고해서 쉽지 않겠구나 생각을 했는데 87점으로 조금은? 안전하게 합격하게 되었다. 자격증 발급 신청까지 해두고 휴 다행이다 생각했던 것 같다. 보유 자격증이 adsp,sqld,빅분기,AICE 이렇게 4가지가 되었는데 나중에 취업할 때 쓸모가 있을 지 모르겠다... 추후에 서류 합격이나 면접 과정에서 해당 자격증들이 언급되면 작성해서 남겨야겠다.

 

* 알고리즘 스터디

이번 주도 마찬가지로 백준에서 랜덤 문제 실버5 ~ 실버1로 난이도를 두고 진행하였고, 문제 하나씩 추천해주면서 마무리하였다. 좀 더 가벼운 느낌의 스터디로 변하게 된 것 같은데 오히려 좋다... 부담감이 사라져서 좀 더 문제 푸는데 집중할 수 있게된 것 같다.

 

앞으로 3주 이내로 모든 기능을 구현하고 발표 준비까지 마쳐야하는데 다른 분들에게 피해가 안가게 최대한 빠르게 내가 할 일을 마치고 다른 분들을 도와주고싶다. 해이해진 정신상태를 부여잡기 위해서 다시 독서를 하고있다. 카네기의 안간관계론을 열심히 읽고 있는데 다들 한번씩 읽어보라고 추천하고싶다. 다음 주에는 조금 더 희망적이게 돌아오고 싶다.

 

남은 3주동안 다른 에이블러 여러분도 힘내봅시당!