이번에 구글 머신러닝 부트 캠프를 진행하면서 Gemma2를 파인튜닝하는 프로젝트를 진행했다. 아이디어 선정 아이디어를 선정할 때 처음에는 크게 떠오르는 것들이 없었는데 다른 분들 하신 것을 보다보니 옛날에 해보고 싶었던 것들이나 재미있는 것들이 떠올랐지만 주제가 겹치거나 너무 간단한 것들이 떠올라서 팀원분과 의논을 했다. 그러다 마침 팀원분이 특허 관련해서 공부하신 분이라 특허와 LLM을 합쳐 특허 명세서 작성을 도와주는 모델을 만들면 좋겠다는 생각이 들었다. 나도 예전에 특허 명세서를 작성하면서 어려움을 겪은 적이 있어서 조금 더 마음이 갔다. 데이터 셋 특허 명세서를 작성하기 위해선 특허 명세서에 대한 데이터 셋이 필요했다. 해당 데이터 셋은 AI-Hub에서 가져오기로 했다. 특허 명세서를 작성하는데..