참여하고 있는 구글 머신러닝 부트캠프에 google 계열의 모델을 개선하거나, 사용하여 앱을 만드는 과제가 있습니다.

저는 캠프에 참여한 목적자체가 제가 하고 있는 일부의 업무를 자동화시키기 위함이었어서 앱을 선택했고, 간단한 프로토타입을 만들어 봤습니다.
사실 pdf 파일에서 테이블을 추출하는 작업은 머신러닝에 맡기기보다는, 직접 형태를 보고 코딩하는 것이 더 나을 수도 있습니다.

하지만 한 번 시도를 해 보았고 가능성은 봤습니다만, 사용하려면 테이블 추출에 적합하도록 모델을 변경하거나 파인튜닝 그리고 데이터 전처리를 확실히 해줘야 되겠네요.
다행히도 제가 처리하고자 하는 내용들은 특정한 포맷을 갖고 있어서 가능할 것으로 보입니다.

(그건 그렇고 노트북으로 하려니 겁나 답답합니다.. 이래서 GPU~ GPU~ 하는구나~)

table Extractor

Gemma2 테스트 - 문서 요약

요약

App 테스트 - 테이블 csv로 출력

csv 출력