Notice
Recent Posts
Recent Comments
Link
01-04 21:46
«   2025/01   »
1 2 3 4
5 6 7 8 9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31
Archives
Today
Total
관리 메뉴

AI 전문가가 되고싶은 사람

[KT 에이블스쿨 기자단] 10주차 회고 본문

기자단 활동

[KT 에이블스쿨 기자단] 10주차 회고

Kimseungwoo0407 2024. 4. 29. 19:39

이번 10주차에는 aice 시험을 어떻게 준비하도록 하세요!!라고 방향을 잡아주는 미니 프로젝트와 유통 판매량 예측 및 재고 최적화를 하는 미니 프로젝트를 진행하였다. 1~2일차에는 aice 시험 준비에 관한 꿀팁과 문제 유형 등을 소개해주고 실제로 풀어보고 팀원들과 이야기를 나누는 식으로 진행하였고, 3~5일차에는 데이터 분석, 데이터 전처리, 모델링을 각각 3,4,5일차에 진행하고 마찬가지로 팀원들과 이야기를 나누어 발표자료를 만들게 하였다.

 

 

1~2일차

먼저 AICE 시험에 대해서 설명을 들었는데 이는 kt에서 개발한 인공지능 능력 시험이라고 한다. 나는 학점이 낮기 때문에 자격증으로 어느정도 커버해야겠다라는 생각을 가지고 있어서 최대한 자세히 들으면서 어떻게 준비해야할지를 생각했다. AICE 시험에는 5단계가 있다 -> PROFESSIONAL, ASSOCIATE, BASIC, JUNIOR, FUTURE

여기에서 KT AIVLE에 속한 에이블러들은 ASSOCIATE 난이도로 시험을 응시하면 된다고 하였다. ASSOCIATE 시험은 데이터 분석, 처리 및 AI 모델링하는 과정으로 이루어져있고, KT AIVLE에서 지금까지 배운 내용이 대부분이여서 반복 숙달하면서 코드와 친해지게 되면 딸 수 있을 거라고 말씀하셨고 구글 검색이 가능하기에 엄청 어렵지는 않을 것이라고 했다. 빅데이터분석기사의 모델링 시험과 비슷한 점도 있다고 하였으니 빅분기 있는 나는 좀 더 쉽지 않을까 생각이 들었다. 

https://aice.study/info/aice/asso
https://aice.study/info/aice/asso

시험이 5월인가 6월에 있다고 하였으니 접수 기간이 되면 얼른 접수해서 취득해버릴 예정이다. 가격대가 다른 자격증에 비해 높다보니 떨어질 생각은 못할 것 같다... ( AIVLE에서 자기계발을 하라고 소정의 지원금을 줘서 그걸로 하면 될 것 같다)

다른 조원분들과 문제를 풀고나서 대화를 나눠보니 다들 그렇게 어렵진 않은 것 같다라는 결론이 나왔고 전체 미팅 시간에 발표 해주신 분들이 공유한 꿀팁으로는 TAB키 없이 코드 작성 연습 + 작성해야하는 칸에 반드시 작성하기 등이 있었다. 나도 나중에 준비하면서 도움이 될만한 것이 있다면 올려봐야겠다.

 

3~5일차 

나는 딥러닝에 굉장히 자신이 없고, 그나마 머신러닝과 친해지려고 노력 중인 사람이라서 이번 프로젝트가 딥러닝 모델을 구축해서 성능을 올려보자이기에 아주 두려웠다. layer를 쌓는 것도 아직 나만의 확신 같은 것이 없이 마구잡이로 쌓았기 때문에 더더욱 그랬던 것 같다. 그래도 이번 미니프로젝트를 진행하면서 부족한 부분을 어느 정도는 채워낸 것 같아 얻어갈 것이 많은 프로젝트였다.

 

* 3일차

데이터에 대해 EDA를 하는 날이였다. 상품의 개수가 너무 많았기에 특정 가게의 특정 상품 3개를 알려주셨고, 이를 조원들끼리 사다리 타기를 해서 2명씩 1개의 상품에 대해서 분석을 하기로 했다. 이 데이터는 시계열 데이터였기에 시계열 패턴을 먼저 확인하고자 그래프를 찍어보았다. 해당 그래프를 보면 확인할 수 있듯이 여름에 판매량이 늘어났고, 겨울에 판매량이 줄어들었다. 내 상품은 계절성을 보이는 상품이라는 것을 알 수 있었다.

내 상품과 같은 카테고리를 가진 상품들의 그래프를 함께 그려보았을 때, 아래 그래프와 같이 나왔다. 여기서 내 상품은 42번이다. 42번의 경우 다른 상품에 비해서 팔리는 양이 아주 작은 것을 알 수 있었다. 

또한, 함께 제공되었던 유가 데이터와 그래프를 그려봤을 때 이런 그래프가 나왔다. 어느정도 상관성이 있어보였지만, 상품 자체의 가격 변동은 없었기 때문에 연관 짓기에 애매했던 것 같다. 그냥 뭔가 있는 거 같은데!! 이 생각만 들었다.

방문 고객수와 판매량 그래프를 그려보았다. 아래와 같은 그래프가 나왔는데 고객이 많던 적던 그냥 계절성을 띄는구나 참 알 수 없는 상품이네 라고 생각이 들었다. 이후에 요일별 판매량을 그려봤는데 금토일에 많이 팔렸다라는 것을 알 수 있었는데 마트 특성상 당연한 거 아닌가 싶어서 따로 추가하지는 않겠다.

나의 상품에 대한 패턴

* 4일차

4일차에는 앞서 했던 데이터 분석을 토대로 전처리 및 베이스 모델을 만드는 시간이였다. 같이 분석하는 조원분과 함께 얘기를 나눠봤을 때 같은 카테고리 상품의 판매 패턴과 비슷하지 않을까라는 생각으로 전처리를 해주고 이동평균을 사용해서 변수도 추가해줬다. 그리고 유가 데이터에 결측값이 있어서 선형 보간법으로 채우고 채워지지 않은 부분은 bfill을 통해서 대체해주었다. 간단한 모델 코드만 만든 후에 4일차는 끝이었다.

 

* 5일차

5일차는 베이스 모델의 성능을 기준으로 더 나은 모델을 구축하는 날이였다. 나는 앞서 언어지능 딥러닝 시간에 사전 훈련된 모델이 굉장히 많은 층을 가지고 있는 것을 보고 베이스 모델에서 층을 엄청 많이 쌓아서 복잡한 모델을 구축해야겠다는 생각을 하고 층을 열심히 쌓았다. 그 후에 성능 평가를 하고 같은 상품으로 모델링을 하고 계신 분에게 성능이 어떻게 나오시냐고 여쭤봤는데 3개 층을 쌓고 나보다 훨씬 나은 성능이 나오는 것을 알 수 있었다... 딥러닝 알다가도 모르겠네 진짜 라는 심정으로 gpt에게 딥러닝에서 층 쌓는 기준을 어떻게 잡아야할까 라고 물어봤는데, "데이터의 복잡도와 양을 고려하고 과적합이 되지 않게 적당히 잘 쌓아주세요"라고 대답을 받았다. 알아서 잘 데이터 양에 따라서 니 알아서 쌓으세요 라고 말해주는 것 같았다. 그래서 다시 한가지를 배울 수 있었다. 많이 쌓는다고 좋은 게 아니라 근거가 있어야 해 근거가 더 공부해야겠다.... 아래 이미지는 내가 학습시킨 모델이 예측한 것으로 매일매일 재고가 부족하지 않으려면 안전 재고를 255개씩이나 가지고있어야한단다. 뭐가 잘못된거지라고 생각할수도 있으니 같은 상품을 담당했던 조원분의 모델이 예측한 것도 가져와보겠다. 일 평균 재고량이 74개로 아주 적은 양으로도 커버를 시키고 있었다.. 하루종일 노력했지만 층 3개를 쌓으신 조원분의 모델이 훨씬 나았다 하하하하하하

내꺼
조원분꺼

 

* 알고리즘 스터디

이번주는 알고리즘 스터디를 하지 않고 공모전에 대해 각자 진행률을 물어보는 시간을 가졌다. 웹이 대한 개념이나 코딩 방법을 하나도 모르기에 나는 머신러닝 구축과 데이터 분석을 맡게 되었다. 앞으로 2주 뒤에는 웹 서비스가 이루어져야하니까 각자 더 열심히 합시다 라고 서로에게 힘을 주었다. 이번 공모전 주제는 단속 구역을 표시하고 주차장을 안내해주는 서비스이다. 아래의 마커를 사용해서 주차장을 안내할 예정이다. 프론트를 맡아주신 ㅈㅈㅇ님이 아주 이쁜 마커와 안내 메세지를 만들어주셔서 완성품이 매우 기대가 되었다.

사용하는 마커
이쁘다...

 나는 주차장에 현재 주차면을 예측하는 머신러닝 모델을 만들었다. 95%의 정확도를 가지고 있으니 어느정도 쓸만한 것 같다. 이후에 하이퍼파라미터 튜닝, 파생 변수 생성과 더 많은 데이터로 학습 시키면 성능이 더 오르지 않을까 싶다.

다음 주 미니프로젝트를 하고 난 후에 AIVLE DAY가 잡혀있는데 이 날에는 뭘 하는지는 모르겠지만 매니저님이 기대해도 좋다고 말씀하셨다. 블로그 서치를 해보니까 웹 개발 넘어가기전에 중간 정산? 이런 느낌이라고 했다. 다음 주를 마지막으로 AI는 끝나고 웹 개발에 대해서 배우게 되는데 나는 웹에 대해서 하나도 모르기 때문에 집중을 해서 잘 듣고 기초 정도는 튼튼히 배워보고싶다. 함께 스터디를 하고 있는 ㅇㅎㅅ씨가 많이 도와줄 것 이라고 하셨기에 그 분을 믿고 혼나면서 배워보려고 한다. 다음 주까지 힘내서 AI 잘 마무리 해보자라는 생각이 든다 하하..