인공지능윤리 01: 생성형 AI의 원리, 특징 및 한계
글에 들어가기 앞서…
이 포스팅은 서울시립대학교 인공지능학과 김현준 변호사님의 ‘인공지능윤리’ 강좌의 전범위 수업 내용에 대한 정리를 담고 있습니다.
수업 자료 출처: https://uclass.uos.ac.kr/mod/ubboard/article.php?id=275039&bwid=181739
생성형 AI란 무엇인가?
생성형 AI는 사용자의 요구에 따라 다양한 결과물을 생성하는 인공지능 기술을 의미합니다. 이러한 AI는 텍스트, 이미지, 영상, 예술작품 등 다양한 콘텐츠를 데이터 학습을 통해 생성할 수 있습니다. 생성형 AI가 낯설게 느껴질 수 있지만, 사실 우리는 이미 여러 곳에서 생성형 AI를 접하고 있습니다.
가장 대표적인 예로, Chat GPT가 있습니다. 많은 사람들이 이미 Chat GPT를 경험해 보았을 텐데요, Chat GPT는 인간이 사용하는 자연어를 생성하는 생성형 AI입니다. 최근에는 웹툰에서도 생성형 AI를 사용하여 배경을 그리는 사례가 종종 있으며, 포토샵 같은 프로그램에서도 생성형 AI를 이용해 배경을 채우는 도구가 존재합니다. 이처럼 생성형 AI는 정말 다양한 분야에서 활용되고 있습니다.
이제 이러한 생성형 AI가 어떤 원리로 동작하는지 간단하게 살펴보겠습니다.
대형언어모델(LLM)
언어모델이란 입력값(prompt)을 기반으로 통계적으로 가장 적절한 출력값을 생성하도록 학습된 모델을 의미합니다. 언어모델은 통계학 기반과 인공신경망 기반으로 나뉘는데, 최근에는 인공신경망 기반의 언어모델이 주로 사용됩니다. 그러나 인공신경망 기반 언어모델에서도 통계학적 지식이 활용되지 않는 것은 아닙니다. 다만, 신경망을 통해 더 많은 추론과 휴리스틱이 사용됩니다.
대규모 언어 모델(LLM)을 학습시키기 위해서는 방대한 양의 말뭉치가 필요합니다. 전문가가 레이블링한 데이터를 통해 모델을 fine-tuning하여 성능을 개선합니다. 이렇게 개선된 LLM은 에이전트화 되어 다양한 프로그램과 결합하고 여러 태스크를 수행합니다.
GPT의 성능 시험을 보면 데이터의 중요성을 실감할 수 있습니다. OpenAI의 최신 모델인 GPT-4는 미국 변호사 시험에서 400점 만점에 298점을 받아 높은 점수로 합격했습니다. 반면, 중국 변호사 시험에서는 평균에 못 미치는 점수로 불합격했습니다. 이러한 차이는 여러 요소가 영향을 미쳤겠지만, 데이터 양의 중요성을 보여주는 대표적인 사례입니다.
리걸테크 응용
생성형 AI를 실무에 활용하려는 시도가 정말 다양한 분야에서 나타나고 있는데요, 법조계에서도 이런 다양한 시도가 일어나고 있습니다. 대표적으로 어떤 것들이 있는지 살펴보겠습니다.
-
OCR 기술
-
그림 출처: https://arxiv.org/pdf/2111.15664
OCR(Optical Character Recognition) 기술은 이미지 문서에서 텍스트를 읽어내고 이를 구조화하는 기술을 의미합니다. 요즘 많은 부분이 디지털로 변환되고 있지만, 여전히 많은 정보가 서면을 통해 수집됩니다. 서면으로 수집된 정보는 구조화하기 어려우며, 나중에 다른 AI를 통해 정보를 추출할 때에도 텍스트 형태로 제공되어야 하기 때문에 OCR 기술이 필요합니다. 때문에, 리걸테크 응용에 있어서 OCR 기술은 필수적입니다.
-
-
정보 추출
정보 추출이란 텍스트에서 필요한 정보를 추출하는 작업을 의미합니다. 법률 서면은 그 양이 방대하고 논리를 전개하는 과정에서 많은 정보가 사용되기 때문에, 이를 읽는 사람은 많은 시간을 소요하게 됩니다. 만약 AI가 필요한 정보를 정확하게 추출하여 제공할 수 있다면, 법조인의 업무 효율성을 크게 높일 수 있을 것입니다.
예를 들어, 사실관계를 제공했을 때 해당 사건명이 무엇인지를 AI가 알려주는 경우가 있습니다.
또는 구체적으로 어떤 법조항에 저촉되는지를 알려주는 경우도 있습니다.
-
텍스트 요약
판결문을 보면 판결요지가 있는데, 이는 판결에서 가장 중요한 쟁점들에 대한 결론을 요약한 부분입니다. AI가 적절하게 학습된다면, 판결요지를 다시 작성하는 데 드는 시간을 절약할 수 있을 것입니다.
판결은 판사의 기분에 따라 결정되는게 아닌데요, 민법의 경우 요건사실론, 형법의 경우 구성요건론에 따라 정해진 논증 절차를 따릅니다. 재판 과정에서는 정말 많은 정보가 수집되는데요, 그 양이 실로 어마어마합니다. 현재까지는 많은 수집 자료 중에서 요건사실, 구성요건에 해당하는 필요한 정보를 사람이 직접 뽑아내야 했지만, AI가 이를 대신 수행할 수 있다면 장문의 텍스트를 전부 읽지 않아도 요건사실이나 구성요건에 해당하는 문장이 어디에 얼마나 포함되어 있는지 알 수 있어 문서 독해 효율이 크게 증가할 것입니다.
예를 들어, 당사자별로 진술 내용을 요약하는 기능이 있을 수 있습니다. 당사자별 진술 내용을 구성요건의 관점에서 요약하는 프로세스를 수행할 수 있습니다. 또는 문서를 시간순으로 요약하는 것도 가능합니다. 법적인 판단을 내릴 때 진술의 일관성은 매우 중요한 요소인데, 이러한 일관성과 모순을 살펴야 하는 법조인들의 업무 효율성을 상당히 향상시킬 수 있을 것입니다.
-
상충 내용 텍스트 찾기
AI에게 여러 기록 사이에 충돌되는 내용을 찾아내도록 할 수 있다면, 형사사건에서는 당사자들의 진술에서 모순점을 빠르게 발견할 수 있고, 민사 사건에서는 다툼 없는 사실과 쟁점을 신속하게 구분할 수 있을 것입니다. 이를 통해 법조인들은 더욱 정확하고 효율적인 업무 수행이 가능해집니다.
-
리서치
재판에서 주장을 펼칠 때는 과거 판례와의 유사점을 짚으며 주장을 전개합니다. 따라서 유사한 과거 판례를 찾는 것이 매우 중요합니다. 단순히 키워드 위주의 검색뿐만 아니라, 문장, 문단, 문서 단위의 검색이 가능하도록 AI를 적용할 수 있습니다. 또한, Chat GPT처럼 대화형으로 검색하는 기능이나 임베딩 기법을 활용해 유사한 사실관계의 판례를 높은 정확도로 찾아주는 방법도 고려할 수 있습니다.
맡은 사건의 사실관계를 입력하면 하급심을 분석해 결론을 예측할 수도 있을 것입니다. 1심과 2심이 사실관계를 명확하게 규정하는 사실심이기 때문에 하급심을 분석하는 것이 중요합니다. 형사사건에서는 유죄와 무죄의 비율을, 민사사건에서는 인용과 기각의 비율을 제시할 수 있을 것입니다.
-
문서 초안 작성
기초사실과 판단 내용을 약식으로 입력하면, AI가 판결문, 공소장/불기소장, 준비서면 등의 법률문서 초안을 작성해 줄 수 있습니다.
-
판결 예측
형사사건의 경우, 사실관계와 양형인자를 통해 형량을 예측하도록 AI를 사용할 수 있습니다. 민사사건의 경우에는, 판결문과 청구취지를 통해 인정된 금액을 예측하도록 학습시킬 수 있을 것입니다.
AI 활용 법학연구 사례
윤창호법으로 유명한 2018.12.24 도로교통법 개정안은 최종적으로 위헌으로 판결되었습니다. 위 헌재 판결에서 주요 쟁점은 명확성 원칙과 책임과 형벌 비례원칙입니다.
-
명확성 원칙
명확성의 원칙은 죄형법정주의의 파생 원칙으로, 법률이 처벌하고자 하는 행위와 그에 대한 형벌을 누구나 예측할 수 있도록 구성요건을 명확하게 규정해야 한다는 것을 의미합니다. 이는 개인이 자신의 행위를 결정할 수 있도록 돕기 위함입니다.
대법원 판례 2013도12939에서는 ‘처벌법규의 구성요건이 명확하여야 한다고 하여 모든 구성요건을 단순한 서술적 개념으로 규정하여야 하는 것은 아니고, 다소 광범위하여 법관의 보충적인 해석을 필요로 하는 개념을 사용하였다고 하더라도 통상의 해석방법에 의하여 건전한 상식과 통상적인 법감정을 가진 사람이면 당해 처벌법규의 보호법익과 금지된 행위 및 처벌의 종류와 정도를 알 수 있도록 규정하였다면 처벌법규의 명확성에 배치되는 것이 아니다.’고 명시하고 있습니다. 이는 명확성 원칙이 절대적으로 명확한 규칙으로 존재하기보다는 평균적인 기대와 일치하면 된다는 해석을 보여줍니다.
이 원칙의 기준은 헌법재판소의 판단을 통해 유추할 수 있습니다. 헌법재판소는 2018.12.24. 도로교통법 개정안의 ‘제44조 제1항을 2회 이상 위반한 사람’ 부분이 명확성 원칙에 위배되지 않는다고 판단했습니다. 이는 법률이 다소 광범위하게 규정되었더라도, 일반인의 상식과 법감정에 부합한다면 명확성 원칙에 어긋나지 않는다는 점을 보여줍니다.
-
책임과 형벌 비례원칙
책임과 형벌간의 비례원칙은 법률의 정당성과 합리성을 확보하기 위해 형벌이 범죄의 중대성과 비례해야 한다는 원칙입니다. 헌법재판소에서는 아래 두 가지를 근거로 2018.12.24. 도로교통법 개정안이 책임과 형벌 비례원칙에 따르지 않는다고 판단했습니다.
- 시간적 제한 없이 무제한적으로 후범을 가중처벌하고 있는 점
- 보호법익에 미치는 위험정도가 큰 행위유형과 경미한 행위유형의 구분 없이 법정형 하한을 2년 이상 징역 or 1천만원 이상 벌급으로 정하고 있는 점
재판부의 선고형 결정과정
법률형, 처단형, 선고형은 형사법에서 범죄에 대한 형벌을 결정하는 과정에서 중요한 개념들입니다. 각각의 용어가 무엇을 의미하는지와 그 차이를 설명해보겠습니다.
법정형
법정형은 법률에 의해 규정된 형벌의 범위를 말합니다. 특정 범죄에 대해 법률이 정해 놓은 형벌의 상한과 하한을 의미합니다. 예를 들어, 형법에 따르면 특정 범죄는 “징역 1년 이상 10년 이하”라는 식으로 법률형이 정해져 있습니다. 이는 법원이 특정 범죄에 대해 내릴 수 있는 형벌의 범위를 명시한 것입니다.
처단형
처단형은 법률형을 기초로 하여, 구체적인 사건에서 법원이 형의 범위를 결정할 때 참고하는 기준입니다. 이는 법률형에서 양형 요소를 고려하여 산출된 형의 범위입니다. 처단형은 범죄의 구체적인 사정, 범행의 동기, 피고인의 전과 등을 고려하여 법률형의 범위 내에서 더 구체화된 형벌의 범위를 설정합니다. 구체적인 처단형 설정 시의 가중경감 사유의 순서는 형법 제56조에 명시되어 있습니다.
-
각칙 본조에 의한 가중
공무원이 직권을 이용하여 본장 이외의 죄를 범한 경우가 이에 해당합니다.
-
제34조 제2항의 가중
간접정범, 특수한 교사, 방조에 대한 형의 가중이 해당됩니다.
-
누범 가중
금고(禁錮) 이상의 형을 선고받아 그 집행이 종료되거나 면제된 후 3년 내에 금고 이상에 해당하는 죄를 지은 사람은 누범(累犯)으로 처벌합니다.
-
법률상감경
필요적 감경사유와 임의적 감경사유에 따릅니다.
-
경합법가중
판결이 확정되지 아니한 수개의 죄 또는 금고 이상의 형에 처한 판결이 확정된 죄와 그 판결확정전에 범한 죄를 정해진 규칙에 따라 형을 합산합니다.
-
작량감경
법률상의 감경사유가 없더라도 법률로 정한 형이 범죄의 구체적인 정상에 비추어 과중하다고 인정되는 경우에 법관이 그 재량에 의하여 형을 감경하는 것을 의미합니다.
선고형
선고형은 법원이 최종적으로 피고인에게 선고하는 형벌을 의미합니다. 처단형의 범위 내에서 법원이 양형 사유를 종합적으로 고려하여 결정한 구체적인 형벌입니다. 예를 들어, 법률형이 징역 1년 이상 10년 이하이고, 처단형이 징역 2년 이상 5년 이하로 결정되었다면, 선고형은 이 범위 내에서 실제로 피고인에게 선고되는 형벌이 됩니다.
선고형을 결정할 때, 양형기준의 권고범위를 고려하여 최종결정을 하게 되는데, 양형기준은 원칙적으로 구속력이 없으나, 법관이 양형기준을 이탈하는 경우, 법원조직법 제81조의7에 따라 판결서에 양형의 이유를 기재해야 하므로, 합리적 사유 없이 양형기준을 위반할 수 없습니다.
경합범
-
실체적 경합
실체적 경합이란 수 개의 행위로 수 개의 죄를 저지른 경우를 의미합니다.
-
동시적 경합
동시적 경합은 여러 개의 죄에 대해 동시에 판결을 받는 일반적인 경우를 지칭합니다. 이 경우, 가장 중한 죄에 대해 정한 형이 사형, 무기징역 또는 무기금고인 경우에는 그 형으로 처벌합니다. 이는 여러 죄에 대한 형량을 합산하는 것이 의미가 없기 때문입니다. 왜냐하면 형량 자체가 무기한이기 때문에, 추가적인 형량이 의미가 없기 때문입니다.
가장 중한 죄에 대한 형이 사형, 무기징역 또는 무기금고가 아닌 경우, 즉 유기징역, 유기금고, 벌금인 경우에는 다음과 같은 기준을 적용합니다:
-
가장 중한 죄에 대해 정한 형벌의 2분의 1까지 가중한 형기 또는 액수,
-
각 죄에 대해 정한 형의 장기 또는 다액을 합산한 형기 또는 액수,
-
50년
이 세 가지 중 가장 적은 것이 처단형의 상한이 됩니다. 사실 유기징역은 30년까지만 가능한데요, 경합과 같이 형량이 가중되는 경우에는 50년까지 가능합니다.
주의할 점은, 금고형과 징역형은 동일한 징역형으로 간주하여 처벌된다는 점과, 다른 종류의 형인 경우에는 형이 병과된다는 점입니다.
-
-
사후적 경합
사후적 경합이란 여러 개의 죄에 대해 동시에 판결을 받지 못한 경우를 의미합니다. 비록 여러 죄가 동시에 판결되지 않았더라도, 시기상 동시적 경합으로 처리될 수 있었다면 이를 고려하여 형을 감경하거나 면제할 수 있습니다. 이는 형사법에서 피고인의 형벌을 공정하게 결정하기 위한 중요한 원칙입니다.
-
-
상상적 경합
상상적 경합이란, 한 개의 행위가 여러 개의 죄에 해당하는 경우에는 가장 무거운 죄에 대하여 정한 형으로 처벌하는 것을 의미합니다.
한계 및 부작용
환각 현상(hallucination)
언어모델의 작동원리는 기본적으로 학습된 데이터를 바탕으로 다음 단어의 확률을 예측하는 것이기 때문에 환각 현상을 피해가기 어렵습니다. 특히 문제가 되는 점은 진실과 거짓이 교모하게 섞이 답변을 제공한다는 점입니다. 때문에 전문가가 아니면 답변의 진실 여부를 쉽사기 파악하기 어렵다는 문제점이 존재합니다.
데이터 편향성
언오모델의 학습 과정에서 편향되고 왜곡된 데이터를 학습시킬 경우, 모델 자체가 편향된 답변을 제공할 가능성이 존재합니다.
그림 인공지능
그림 인공지능이란 이용자가 입력하는 단어나 문장으로 된 데이터를 이해하여 요청에 맞는 그림을 생성하는 AI를 의미합니다. 대표적으로는 트랜포머 자기회귀 모델, 디퓨전 모델 구조가 있습니다.
기본 원리
- 텍스트와 이미지를 토큰 시퀀스로 변환합니다.
- 트랜스포머 아키텍처를 활용해 텍스트 시퀀스를 통해 이미지 시퀀스를 예측합니다.
- 이미지 생성 기술(VAE, GAN, Diffusion)을 사용해 이미지 시퀀스를 디코딩하여 최종 이미지를 생성합니다.
최근에는 디퓨전 기술이 주목받고 있으며, 중복된 그림이 나올 확률이 매우 낮다는 장점이 있습니다.
기타 개념
- 지시척도(guidance scale): 이미지 생성 프로세스에서 설명문을 따르는 정도를 제어하는 매개변수입니다. 이 값을 극단적으로 낮추면 입력된 텍스트가 무시될 수 있습니다. 반대로 값을 높이면 품질이 떨어질 수 있지만 입력한 단어를 더 정확하게 따라 생성됩니다.
- 단계 매개변수(step parameter): 프롬프트의 지시에 따라 노이즈를 반복적으로 제거하는 총 단계수를 의미합니다. 이 파라미터를 높게 설정하면 생성된 이미지의 품질이 좋아지고, 다른 이미지가 나올 확률이 올라갑니다. 그러나 일정 수준 이상으로 계속 높이면 품질 향상이 더 이상 나타나지 않고, 오히려 생성 속도가 느려질 수 있습니다.
댓글남기기