이 글은 산업 특화 AI LLM, VLM 모델 개발 사례 및 기술 분석 내용을 간략히 정리한 것이다.
산업 분야 복합추론(Complex Reasoning) 특화 모델 및 파이프라인 개발을 위해 최근 3년 내 공개된 국내외 도메인 특화 모델의 개발 사례를 정리한다. 의료, 법률, 과학 등 타 전문 도메인에서 환각(Hallucination)을 제어하고 다단계 논리 추론을 성공시킨 파이프라인의 핵심 구조와 데이터셋 예시를 정리하고, 이를 건설, 기계제조, 물류 분야에 적용한 최신 기술 트렌드를 제시한다.
타 도메인 특화 복합추론 모델 및 파이프라인 사례
Fully Open Meditron (의학 분야)
- 개념 및 특징: EPFL 연구진 등이 개발한 의료 특화 LLM 파이프라인으로, 학습 데이터셋 구축부터 정제, 평가까지 전 과정을 완전히 투명하게 공개한 오픈소스 프로젝트이다. Base 모델의 환각을 방지하기 위해 임상 지침(Clinical Guidelines)에 기반한 검증 루프와 전문가 검토(Clinician-vetted) 과정을 거쳐 합성 데이터를 증강하는 파이프라인을 구축하였다.
- 프로젝트 링크: EPFLiGHT FullyOpenMeditron GitHub / Fully Open Meditron 논문
데이터셋 예시 (Instruction Tuning Format):
{
"instruction": "임상 가이드라인에 기반하여 환자의 증상을 진단하고 치료 계획을 수립하라.","input": "환자(65세, 남성)는 고혈압 기왕력이 있으며, 2시간 전부터 시작된 극심한 흉통과 호흡곤란을 호소함. 혈압 160/95 mmHg, 심박수 105회/분.","thought": "1. 흉통과 호흡곤란은 급성 관상동맥 증후군(ACS) 또는 대동맥 박리의 가능성을 시사함. 2. 고혈압 기왕력이 있으므로 심전도(ECG) 및 트로포닌 수치 확인이 최우선임. 3. 가이드라인에 따라 산소 공급 및 아스피린 투여를 고려해야 함.","output": "급성 관상동맥 증후군(ACS)이 의심되므로 즉시 12유도 심전도 검사 및 심근효소(Troponin) 검사를 시행해야 한다. 가이드라인에 의거하여 금기가 없는 한 아스피린 300mg을 즉시 경구 투여하고 응급 심혈관 중재술이 가능한 시설로 이송을 준비한다."
}
PMC-LLaMA (의학·바이오 분야)
- 개념 및 특징: PubMed Central(PMC)의 학술 논문 480만 편 이상을 기반으로 LLaMA 모델을 지속 사전학습(Continued Pre-training, CPT)하고 의학적 인과관계를 추론할 수 있도록 미세조정한 모델이다. 의학적 텍스트 간의 복잡한 상관관계를 학습하여 전문 지식 부족으로 인한 환각을 대폭 줄였다.
- 프로젝트 링크: [chaoyi-wu PMC-LLaMA GitHub](https://github.com/chaoyi-wu/PMC-LLaMA)
데이터셋 예시 (Medical QA Format):
{
"instruction": "제시된 의학적 질문에 대해 논리적 근거와 함께 최적의 옵션을 선택하라.","input": "질문: 23세 임산부가 배뇨 시 타는 듯한 통증으로 내원함. 비용 차단이나 약물 알레르기는 없음. 늑골척추각 압통은 없음. 다음 중 가장 적절한 치료제는 무엇인가? 옵션: A. Ampicillin, B. Ceftriaxone, C. Doxycycline, D. Nitrofurantoin","output": "정답은 D. Nitrofurantoin이다. 임신 중 발생한 단순 방광염(Uncomplicated Cystitis)의 1차 치료제로는 Nitrofurantoin 또는 Amoxicillin-clavulanate가 권장된다. C는 임산부에게 금기이며, A와 B는 단순 방광염의 1차 선택지로 부적절하다."
}
Saul-LM (법률 분야)
- 개념 및 특징: 법률 도메인에 특화된 7B 규모의 모델로, 대규모 법률 코퍼스로 CPT를 수행한 후 법률 명제 생성 및 조항 검토의 formal validity(형식적 타당성)를 극대화하도록 파이프라인이 설계되었다. 계약서 해석이나 규제 준수 여부를 다단계로 추론하는 데 특화되어 있다.
- 프로젝트 링크: sxu3 LP-Eval GitHub (Saul-LM 평가 및 벤치마크)
데이터셋 예시 (Legal Reasoning Format):
JSON
{
"instruction": "법률 조항과 분쟁 상황을 분석하여 귀책 사유 및 계약 위반 여부를 추론하라.","input": "계약조항: 제12조(지체상금) 공급자가 약정된 기한 내에 목적물을 인도하지 못할 경우, 지체일수 1일당 총 계약금액의 0.1%를 지체상금으로 지급한다. 단, 불가항력적인 사유는 예외로 한다. 상황: 공급업체 A는 홍수로 인한 원자재 수급 불능으로 인해 납기를 10일 지체함.","thought": "1. 홍수가 계약서 상 '불가항력적 사유'에 부합하는지 민법 및 판례 기준 검토 필요. 2. 일반적인 기상 악화와 달리 재해 수준의 홍수는 불가항력으로 인정될 여지가 있음. 3. 따라서 지체상금 면제 조항이 적용될 가능성이 높음.","output": "공급업체 A의 납기 지체는 홍수라는 자연재해(불가항력적 사유)에 기인한 것이므로, 제12조 단서 조항에 따라 지체상금 지급 의무가 면제될 가능성이 높다. 다만, 홍수 발생 직후 지체 없이 이 사실을 통보하고 증빙했는지 여부를 추가 확인해야 한다."
}
SciGLM (과학·공학 분야)
- 개념 및 특징: 수식, 공학적 메커니즘, 화학식 등 다단계 논리 추론이 필수적인 과학 도메인을 위해 개발된 모델이다. 데이터 부족 문제를 해결하기 위해 '자가 반성적 지시어 주석(Self-Reflective Instruction Annotation)' 프레임워크를 도입하여, 모델 스스로 추론 단계를 비판하고 수정하는 파이프라인을 구축하였다.
- 프로젝트 링크: [THUDM SciGLM GitHub](https://github.com/THUDM/SciGLM)
데이터셋 예시 (Scientific Reasoning Format):
{
"instruction": "물리학적 법칙을 적용하여 주어진 공학적 문제를 해결하고 계산 과정을 기술하라.","input": "질량 10kg의 물체가 마찰이 없는 30도 경사면을 따라 미끄러져 내려갈 때, 물체의 가속도를 구하라. (중력가속도 g = 9.8 m/s^2)","thought": "1. 경사면을 따라 내려가는 힘 F = m * g * sin(theta)이다. 2. 뉴턴의 제2법칙 F = m * a를 적용하면 m * a = m * g * sin(theta)가 된다. 3. 질량 m을 소거하면 가속도 a = g * sin(theta)이다. 4. sin(30도) = 0.5이므로 9.8 * 0.5를 계산한다.","output": "경사면 방향으로 작용하는 성분력은 $F = mg \sin(30^\circ)$이다. 뉴턴의 제2법칙($F=ma$)에 의해 $ma = mg \sin(30^\circ)$가 성립하므로, 가속도 $a = g \sin(30^\circ)$가 된다. 따라서 가속도는 $9.8 \times 0.5 = 4.9 \text{ m/s}^2$이다."
}
산업 분야별 특화 모델 학습 및 파이프라인 개발 사례
건설(Construction) 분야
건설 표준 시방서(KDS, KCS), 설계 가이드라인, 국토교통부 고시 법령 등 방대한 건설 도메인 문서를 CPT 및 SFT로 학습시키는 파이프라인이다. 수치적 기준과 규제 조건의 환각을 방지하기 위해 LLM을 지식 그래프(Knowledge Graph) 및 BIM(빌딩정보모델링) 메타데이터와 결합한 'Agentic RAG' 구조를 주로 채택한다.
데이터셋 예시 (건설 시방서 복합추론):
JSON
{
"instruction": "국가건설기준에 의거하여 현장 시공 계획의 적합성을 판정하고 근거를 제시하라.","input": "현장 상황: 건축물 지하 외벽 콘크리트 타설 계획 중임. 설계 강도는 24MPa이며, 동절기 환경(일평균 기온 2도)에서 시공 예정임. 현장 감리는 일반 포틀랜드 시멘트를 사용한 표준 배합으로 타설을 승인하려 함.","thought": "1. 일평균 기온이 4도 이하로 떨어지는 동절기 환경이므로 '동절기 콘크리트(한중 콘크리트)' 규정이 적용되어야 함. 2. 한중 콘크리트 시공 시 초기 동해 방지를 위한 양생 및 가열 계획이 필수적임. 3. 일반 배합 그대로 타설 시 초기 동해로 인한 균열 및 강도 저하 리스크가 매우 큼.","output": "적합성 판단: 부적합. 일평균 기온이 4도 이하인 조건이므로 KCS 14 20 40(한중 콘크리트) 기준에 따라 특수 배합 및 보온 양생 계획이 수립되어야 한다. 일반 포틀랜드 시멘트를 사용한 표준 배합으로 동절기에 그대로 타설할 경우 초기 동해로 인한 구조물 성능 저하가 발생하므로, 가열 양생 또는 동결방지제 사용 계획을 포함한 시공 계획서로 전면 수정해야 한다."
}
기계제조(Manufacturing) 분야
설비 매뉴얼, 고장 형태 영향 분석(FMEA) 문서, 센서 알람 로그 데이터를 결합한 문제 해결형 추론 모델 파이프라인이다. 텍스트 로그가 입력되면 고장의 근본 원인을 추론하고 정비 절차(SOP) API를 호출하는 'Tool-use 파이프라인' 형태로 구동된다.
데이터셋 예시 (설비 고장 진단 복합추론):
{
"instruction": "제조 설비의 에러 로그와 정비 매뉴얼을 매칭하여 근본 원인을 분석하고 조치 절차를 생성하라.","input": "로그 데이터: [Error Code 0x4F2] CNC 밀링 머신 주축(Spindle) 과부하 및 온도 85도 돌파. 유압 시스템 압력 저하 발생.","thought": "1. 에러 코드 0x4F2는 주축 과열 관련 오류임. 2. 유압 압력 저하가 동반된 것으로 보아 냉각유 공급 펌프 오작동 또는 유압 라인 누유 가능성이 높음. 3. 조치 순서는 주축 정지 -> 유압 압력 체크 -> 냉각 시스템 점검 순이어야 함.","output": "근본 원인 분석: 유압 시스템 압력 저하로 인한 주축 냉각 유량 부족 및 마찰열 발생으로 추론됨. 조치 절차: 1단계 - CNC 장비를 즉시 비상 정지하여 주축 손상을 방지함. 2단계 - 유압 펌프 레벨 및 라인 누유 여부를 육안 점검함. 3단계 - 냉각기(Chiller)의 필터 막힘 상태를 확인 후 정비 매뉴얼 4-1장에 따라 유압 밸브를 리셋함."
}
물류(Logistics & SCM) 분야
공급망 지연, 기상 변화, 통관 리스크 등 비정형 돌발 변수가 발생했을 때 대안 경로와 운영 비용을 자율 계산하는 수학적 추론 모델 파이프라인이다. LLM이 상황을 파악한 뒤 직접 최적화 알고리즘 코드(Python)를 생성하여 실행하고, 에러가 발생하면 자가 교정(Self-Correction)하는 구조로 개발된다.
데이터셋 예시 (SCM 돌발 상황 의사결정 추론):
JSON
{
"instruction": "물류망 마비 상황에 대응하는 대체 운송 라우팅 계획을 수립하고 물류비용 변화를 추론하라.","input": "상황: A항구 파업으로 인해 예정된 부품 500톤의 하역이 불가능함. 대체 항구 B를 이용할 경우 내륙 운송 거리가 150km 증가하며, 트럭 운송 단가는 톤·km당 150원임.","thought": "1. 대체 경로 B 선택 시 추가 내륙 운송 비용 산출 필요. 2. 추가 비용 = 500톤 * 150km * 150원 = 11,250,000원. 3. 납기 지연으로 인한 페널티 비용과 비교하여 최종 의사결정을 내려야 함.","output": "대응 계획: 선박을 대체 항구 B로 회항 조치한다. 이로 인해 발생하는 추가 내륙 물류비용은 총 11,250,000원($500 \times 150 \times 150$)으로 산출된다. 이는 원래 항구 A에서 파업 종료를 대기할 때 발생하는 라인 중단 페널티 비용(일일 50,000,000원 상당)보다 경제적이므로 회항 파이프라인을 즉시 가동하는 것이 타당하다."
}
결론
Fully Open Meditron이나 SciGLM 같은 도메인 특화 모델들의 성공 요인은 단순한 텍스트 학습이 아니라, 전문가의 사고 흐름을 모방한 논리적 추론 경로(Chain-of-Thought, Thought 태그) 데이터의 대량 구축 및 정제에 있다.
따라서 현재 진행 중인 건설 AI 연구에서 환각을 제어하고 복합추론 능력을 강화하기 위해서는 아래와 같은 파이프라인 구축 전략이 요구된다.
- 지식 주입과 논리 분리: Base 모델에 억지로 암기시키기보다 구조화된 텍스트 코퍼스로 CPT를 수행한 뒤, RAG 파이프라인과 결합하여 데이터의 정확성을 보장해야 한다.
- CoT 데이터셋 합성: 실제 엔지니어의 문제 해결 프로세스를 `<thought>` 태그 내에 단계별(Step-by-step)로 명시한 지시어 데이터셋을 최소 수만 건 이상 구축하여 SFT를 진행하는 것이 필요하다.
레퍼런스
- Open Meditron, a fully open, clinician-audited medical training corpus and evaluation protocol that closes the open-vs-closed gap on open-ended clinical evaluation.
- MeditronFO - a EPFLiGHT Collection
- data/README.md · EPFLiGHT/fully-open-meditron at main
- Meditron is a suite of open-source medical Large Language Models (LLMs).
- 오픈소스 의료 LLM '메디트론FO'
부록: 데이터 학습 파이프라인 예시
파이프라인
[Base Model] ---> [1. CPT 단계] -----------> [2. SFT/Reasoning 단계] --> [3. RAG/Agent 단계] - 스케일: 20B~30B 토큰 - 스케일: 5만~10만 건 지시어 - 실시간 수치 검증 - 목적: 건설 용어/지식 주입 - 목적: CoT(<thought>) 추론 - 목적: 환각 완전 제어
CPT(지속 사전학습) 코퍼스 예시
{"text": "[건설기준코드: KDS 41 10 05 : 2022 건축구조기준 총칙] 3. 설계하중 (1) 건축물 및 구축물은 구조적 안전성을 확보하도록 이 기준에서 규정한 고정하중, 활하중, 적설하중, 풍하중, 지진하중 등의 설계하중에 대하여 견딜 수 있도록 구조 설계되어야 한다. (2) 특수한 환경에 위치한 구조물의 경우, 토압, 수압, 파랑하중, 온도하중 등 발생 가능한 모든 유효한 하중의 영향을 추가로 고려하여야 한다.", "metadata": {"source": "국가건설기준센터", "domain": "건설_구조공학", "doc_type": "KDS", "code_id": "KDS_41_10_05", "year": "2022"}}{"text": "[LH 전문시방서: 31510 콘크리트공사] 2.1 재료 (1) 한중 콘크리트 시공 시 사용하는 시멘트는 고로슬래그 시멘트의 초기 강도 발현 지연을 고려하여, 특별한 지정이 없는 한 일반 포틀랜드 시멘트(KS L 5201) 사용을 원칙으로 한다. (2) 초기 동해 방지를 위해 가열 양생 시, 급격한 건조 및 온도 변화로 인한 균열 방지 대책을 시공 계획서에 명시하여야 한다.", "metadata": {"source": "LH공사", "domain": "건설_시공공학", "doc_type": "Specification", "code_id": "LH_31510", "year": "2024"}}
지도 미세조정 코퍼스 예시
{"messages": [{"role": "user","content": "현재 동절기 환경(일평균 기온 1.5도)에서 지하 주차장 슬래브 콘크리트 타설을 준비 중이다. 시공사에서 조강 포틀랜드 시멘트를 사용하고, 타설 후 2일간 천막을 치고 갈탄을 태워 보온 양생을 하겠다는 계획서를 제출했다. 이 시공 계획의 기술적 문제점과 국가건설기준에 따른 보완 요구사항을 추론하라."},{"role": "assistant","content": "<thought>\n1. 주어진 상황 분석: 일평균 기온 1.5도이므로 KCS 14 20 40(한중 콘크리트) 적용 대상이다.\n2. 시공사 계획 검토:\n - 자재: 조강 포틀랜드 시멘트 선택은 초기 강도 확보에 유리하므로 타당하다.\n - 양생 방법: 갈탄 보온 양생 계획 수립함.\n3. 갈탄 양생의 문제점 인출:\n - 갈탄 연소 시 발생하는 이산화탄소(CO2)가 콘크리트 표면과 반응하여 탄산화(중성화)를 유발함. 이는 표면 강도 저하 및 균열의 원인이 됨.\n - 밀폐 공간 내 일산화탄소(CO) 축적으로 인한 작업자 질식 재해 위험 존재.\n4. 국가건설기준(KCS) 부합성 체크:\n - KCS에서는 한중 콘크리트 가열 양생 시 이산화탄소에 의한 탄산화 방지 대책을 세우거나 열풍기 등 간접 가열 방식을 권장함.\n5. 결론 및 보완 지시 도출:\n - 갈탄 양생 전면 수정 또는 CO2 배출 제어 대책 요구.\n - 열풍기(전기 또는 가스) 방식으로 변경 권고.\n - 작업자 출입 통제 및 환기 시설 매뉴얼 추가 요구.\n</thought>\n제출된 시공 계획서는 국가건설기준(KCS 14 20 40 한중 콘크리트) 및 현장 안전 관리 기준에 의거하여 승인 불가하며, 아래와 같은 기술적 문제점에 대한 보완 조치가 필요하다.\n\n1. 콘크리트 품질 저하 (탄산화 위험):\n갈탄 연소 시 대량의 이산화탄소(CO2)가 발생한다. 경화되지 않은 초기 콘크리트 표면이 고농도의 이산화탄소에 노출되면 수화 생성물인 수산화칼슘과 반응하여 탄산칼슘을 형성하는 '초기 탄산화(중성화)' 현상이 발생한다. 이는 콘크리트 표면을 푸석하게 만들고 장기적인 내구성을 심각하게 저하시킨다.\n\n2. 보완 요구사항:\n- 가열 방식을 갈탄 연소 방식에서 이산화탄소 발생이 없는 전기 열풍기 또는 가스식 열풍기(간접 가열) 방식으로 변경하여 재제출해야 한다.\n- 만약 부득이하게 갈탄을 사용해야 할 경우, 콘크리트 표면에 CO2가 직접 닿지 않도록 완전 밀폐 및 외부 배기 덕트 라인 설치 계획을 수립해야 하며, 질식 사고 방지를 위한 산소 및 CO 농도 측정기 배치, 환기 팬 가동 계획을 안전 계획서에 추가해야 한다."}]}
RAG 에이전트 코퍼스 포맷 예시
{"messages": [{"role": "user","content": "강재 휨재의 국부좌굴을 검토하려고 한다. SM355 강재를 사용한 H형강 보의 플랜지 폭두께비 제한값을 확인하고 싶다. 관련 설계를 진행할 수 있도록 국가건설기준 규격을 조회하여 판단하라."},{"role": "assistant","content": null,"tool_calls": [{"id": "call_const_api_01","type": "function","function": {"name": "search_kds_limits","parameters": {"standard_code": "KDS 41 31 00","keyword": "플랜지 폭두께비 제한값","steel_grade": "SM355"}}}]},{"role": "tool","tool_call_id": "call_const_api_01","name": "search_kds_limits","content": "{\"status\": \"success\", \"result\": \"KDS 41 31 00 건축강구조설계기준 표 4.1-1: SM355 강재의 휨재 플랜지 폭두께비(b/t) 제한값 - 조밀단면 한계: 0.38*sqrt(E/Fy) = 9.1, 비조밀단면 한계: 1.0*sqrt(E/Fy) = 24.0 (단, 탄성계수 E=210,000MPa, 항복강도 Fy=355MPa 기준 적용)\"}"},{"role": "assistant","content": "<thought>\n1. 외부 Tool을 통해 KDS 41 31 00의 정확한 수치 정보를 수신함.\n2. SM355 강재 기준, 플랜지의 조밀단면 한계 폭두께비는 9.1이며 비조밀단면 한계는 24.0임을 확인.\n3. 수신된 데이터에 기반하여 환각 없이 사용자에게 설계 가이드라인을 제공함.\n</thought>\n조회된 국가건설기준(KDS 41 31 00 건축강구조설계기준)에 따른 SM355 강재 휨재 플랜지의 폭두께비($b/t$) 제한값 기준은 다음과 같다.\n\n1. 조밀단면(Compact Section) 한계값: 9.1\n2. 비조밀단면(Non-compact Section) 한계값: 24.0\n\n설계하시는 H형강 보 부재의 플랜지 폭두께비 산정 값이 9.1 이하일 경우 조밀단면으로 분류되어 부재의 소성 휨모멘트 성능을 온전히 발휘할 수 있으나, 9.1을 초과하고 24.0 이하일 경우 비조밀단면으로 분류되어 국부좌굴을 고려한 휨강도 감소 처리를 해야 한다."}]}