목록분류 전체보기 (70)
AI 전문가가 되고싶은 사람
1. 인공 뉴런- AI를 설계하기 위해 생물학적 뇌가 동작하는 방식을 이해하려는 시도 -> 맥컬록-피츠 뉴런 (MCP)- MCP 뉴런 모델을 기반으로 퍼셉트론 학습 개념을 발표했고 퍼셉트론 규칙에서 자동으로 최적의 가중치를 학습하는 알고리즘 제안 1.1 인공 뉴런의 수학적 정의- 0과 1 두개의 클래스가 있는 이진 분류 작업으로 볼 수 있음.- 입력 값 x와 이에 상응하는 가중치 벡터 w의 선형 조합으로 결정 함수를 정의. \( z = w_1 x_1 + w_2 x_2 + \cdots + w_m x_m \)" data-ke-type="html">HTML 삽입미리보기할 수 없는 소스 단위 계단 함수를 변형하여 임계 값 θ보다 크면 클래스 1로 예측하고, 그렇지 않으면 0으로 예측 \[ \s..
딥러닝 분야에서 TensorFlow와 PyTorch는 주요 라이브러리로 널리 사용되고 있습니다. 최근에는 PyTorch가 특히 많은 인기를 끌고 있는 추세입니다. PyTorch의 직관적인 코드 작성 방식과 유연한 동적 계산 그래프는 연구자와 개발자들 사이에서 큰 호응을 얻고 있습니다. 이와 같은 흐름을 감안할 때, PyTorch를 학습하는 것은 현재의 딥러닝 트렌드에 맞춰 나의 기술을 업그레이드하는 중요한 단계가 될 것입니다. 1. 학부 시절 머신러닝 기초 복습딥러닝과 PyTorch를 효과적으로 학습하기 위해서는, 우선 학부에서 배웠던 머신러닝의 기초 개념을 다시 한번 정리하며 공부할 필요가 있다고 생각했습니다. 2. PyTorch 사용법 익히기"머신 러닝 교과서 파이토치편"을 활용하여 PyTorch의 ..
1. 지도학습레이블된 훈련 데이터에서 모델을 학습하여 본 적 없는 미래 데이터에 대해 예측을 만드는 것이다.개별 클래스 레이블이 있는 지도 학습을 분류라고 하고, 연속적인 값을 출력하는 것을 회귀라고한다. * 지도 : 희망하는 출력 신호(레이블)가 있는 일련의 샘플(데이터 입력)을 의미한다.1-1 분류- 지도 학습의 하위 카테고리로 과거의 관측을 기반으로 새로운 샘플 또는 새로운 데이터 포인트의 범주형 클래스 레이블을 예측하는 것이 목적이다. * 클래스 레이블 : 이산적이고 순서가 없어 샘플이 속한 그룹으로 이해할 수 있다. 1-2 회귀-연속적인 출력 값을 예측하는 것을 회귀분석이라고 한다. 회귀는 예측 변수와 연속적인 반응 변수가 주어졌을 때 출력 값을 예측하기 위해 두 변수 사이의 관계를 찾는다. 1..
24주차 회고를 시작해보겠다! 모든걸 마무리하였다... 1. 마무리 주차...스튜디오 녹음에 시연영상 촬영에 덜 마무리된 기능들을 손보면서 정신 없이 보냈다.. 시연영상도 찍고 발표영상도 미리 찍어두고 음성을 넣으려고했으나 계속 수정이 있어서 진짜 정신 없었다 진짜 큰일이다 생각하고 최대한 빨리 했던 것 같다. 그래서 매일 늦게까지 작업을 하고 시나리오를 쓰고 스크립트를 짰다. 영상 편집도 늦은 새벽까지 해주신 ㅇㅅㅇ님 감사합니다. 함께 차로 이동해주신 ㄱㅈㅇ님 감사합니다. 덕분에 편하게 가서 열심히 일할 수 있었어요. ㅂㅅㅇ님 감사합니다 그냥 감사해요 아래 이미지와 같이 6주 동안 사용한 figma를 보니 진짜 다들 열심히 하셨구나 싶었다. 자랑할만한 저희의 UI 보여드리겠습니다. 저희가 제공하는 ..
23주차 회고를 시작해보겠다.. AI 기능 개발이 완료되었다고 생각했으나, 실제로는 연결 과정에서 입력과 출력 형식을 조정해야 한다는 것을 알게 되었고, 이를 해결하기 위해 파이프라인을 구축하는 일을 시작으로 ppt에 붙어서 열심히 작업을 하였다. 1. 요약 모델 (하이퍼파라미터 조정)mt5-small 모델의 하이퍼파라미터를 조정해서 어떻게 했을 때 잘 나오는지를 고민하고 확정하였다. 자소서는 보통 500~1000자의 텍스트가 들어가게 되는데 min_length와 max_length를 너무 낮게 두면 자소서 내용이 많이 소실되기 때문에 150이상 500자 이하로 설정해두었다. 앞서 언급한 내용과 마찬가지로 내용 소실을 막기 위해 length_penalty도 디폴트 값보다 높게 두어 더 길게 생성하게 설정..
22주차 회고를 시작해보겠다.. 저번 주에 말은 안했지만 코치님께서 AI 팀은 분발해야겠네요. 모델을 얼른 끝내야 기능 추가가 가능하니까 힘내봅시다!! 라고 말씀하셨다. 뭔가를 열심히 공부하고 노력하고있지만 실패를 하고있던 와중에 그런 얘기를 들어서 같은 팀원분은 매우 좌절하셨다 내가 지금 하는게 팀에 도움이 되는건가.. 그래서 이번 주에 진짜 열심히 AI팀이 갈아넣은 것을 리뷰해보겠다. 1. 자소서 기술 뽑아내기아래 이미지와 같이 자기소개서 텍스트가 들어오면 지원자가 가지고 있는 기술과 어떤 직종에 어울리는 자기소개서인지를 뽑아내보았다. 처음에는 openai gpt api로 자소서 내용을 다 넣고 기술이랑 직종 뽑아줘 라고 했었는데 매번 다른 답변이 나오거나 몇개의 기술이 뽑히지 않는 경우가 잦았다. ..
이번 21주차에도 앞선 주차들과 마찬가지로 열심히 또 열심히 모델 구현에 힘 써보았다. 나중에 똑같이 빅프로젝트를 하게 될 6기 여러분 미리 공부를 해두면 더 좋을 것 같아요... 닥친 상황에서 공부하고 알아보고 하니까 쉽지가 않네요... 이번 주에 있었던 여러가지 수정 사항을 적어보겠다. 1. 요약 모델 파인튜닝 ( 6,000개 -> 23,000개 )앞서 mt5-small 모델을 파인튜닝할 때 잡코리아에서 합격 자소서를 크롤링하여 6,000개의 데이터를 구축하여서 6,000개 자소서의 여러 개의 질문 중 한 질문에 대한 답변을 요약시켜서 파인 튜닝을 했었다. 따라서 6,000개를 사용하였는데, 이번 주에는 각 질문에 대한 답변을 textrank 모델을 통해서 요약을 하여 약 30,000개의 데이터를..
이번 20주차에는 19주차와 마찬가지로 타당성 검토를 하였다. 19 주차에는 Weekly scrum만 제출했지만, 20주차에는 모델 정의서와 데이터 정의서를 작성하여 제출하였다. 이제 본격적으로 시작하는 느낌이 들어서 열심히 노력 중이다. 1~2일 - 모델링, 크롤링저번 주에서 말했듯 새로운 기능들을 추가하게 되어서 모델 선택부터 다시 시작하였다. 사용할 모델들을 찾아보면서 이건 되고 이건 안되고 또 분류를 해서 다른 조원분들에게도 공유를 하였다. 아래는 제외한 기능들이다. AI 면접 같은 경우에 아래와 같이 오디오를 녹취해서 녹취본을 토대로 텍스트화, 감정분류한 뒤에 요약본을 만들 예정이였고 여러 고민들을 해보았지만 코치님께서 다른 조가 AI 면접 자체를 주제로 잡아서 한다는 말씀을 해주셔서 그러면 과..