2024년 6월 16일 일요일

LLM 의 통계적 패턴 예측성과 한계에 대한 연구

요즘 AI 연구자들이 LLM에 대한 잠재력을 연구하고 있는 분위기가 있는 데, 마침 Google, DeepMind 연구팀으로 부터 관련된 논문이 나왔다. 이 연구는 LLM을 AGI와 같은 Multi function AI로 사용할 수 있는 지에 대한 근본적 성찰과 한계를 밝히는 연구이다.

이와 관련해, github에 해당 코드 등을 공유하고 있다. 
레퍼런스
다음 글은 여러 시사점을 준다. 참고용으로 기록한다. 

추신. 개인적으로 극단을 경계하는 성격이라, LLM이 AGI 도구 보단, 통계적 패턴의 예측 함수로 인식하고 있었는 데, 워낙 너도 나도 LLM으로 다 할 수 있다는 듯 뛰어드는 분위기라... 약장사 구분하기 위해 개인적으로 계속 논문, 소스코드 분석하고, 정리하고 있었다. ChatGPT 충격?에서 2년 가까이 지난 뒤에서야, 나름 국제적 연구진이 연구한 이런 결과들이 나오는 것을 보면, 대부분 어떤 트랜드가 있을 때, 98%는 언론에서 잘 모르고 무책임하게 말하는 것을 따라 휩쓸린다는 것을 한번 더 느낀다. 
이 정도에서 약간 국내 기술 수준도 털리는 느낌인데, 지나서 잠시 생각해 보면, 아무도 그 수준의 연구나 성찰을 화려한 스타군단으로 구성된 AI스타트업, 연구실에서 언급한 적을 논문 언론 등을 통해 한번도 본적이 없었다는 것이다(심지어, 그 스타군단에서 huggingface, langchain처럼 스스로 자랑?하는 성과를 github에서 거의 본 적 없다 보니, 놀랄만한 일이 아니다). 깊게 연구 성찰한 후에야, LLM이 할 수 있는 것들(기능. 무엇은 되고, 어떤것은 안된다 정도)에 대해 자신있게 말할 수 있을 텐데, 이름, 돈, 상황(패닉?)에 눈이 멀어, 깊은 성찰과 연구는 없고, 약장사 만 많은 건은 어쩔 수 없나 보다. 어느 분이 말한 것처럼, 국내 시장의 한계인 듯 하다. 

역사는 반복되는 듯... 인생, 시간이 아까우면, 마음이 급하더라도, 좀 깊게, 하나씩 어떤 물건인지 잘 살펴보는 게 정답이다. 2024.6.6

댓글 없음:

댓글 쓰기