새소식

[포스코]청년아카데미/AI입문

Artificial Intelligence 인공지능 입문(포스텍 유환조 교수님)

  • -

  • 이제는 사람만큼 인공지능이 잘 인식을 한다. 
    • 물체, 자율주행, 언어 등
    • ex1. 자연어 처리; 글의 맥락을 보고 긍정적인지 부정적인지 판단할 수 있음.
    • ex2. 자연어 처리; 컴퓨터 비전은 사람만큼 인식을 하지만 자연어 처리는 아직 인간만큼 발전하지 못했음. 인공지능에서 가장 어려운 분야라고 생각함
    • 알파고. 최적의 결과를 찾는 것 뿐 (소프트웨어, 알고리즘)
      • 자세한 technical 한 부분을 배우고 싶다면, 인공지능 수업을 들어라
  • 기계의 본능 -> 생명 유지. 전력 공급. -> 인간유지 (매트릭스 영화 중)
    • 기계에 인간의 감정이나 정서를 심는 것은 아주 다른 이야기이다. 

  • 암흑기와 성황기를 계속 해서 반복을 했고, 지금은 딥러닝의 전성시대라고 볼 수 있음. 
    • 지금은 눈부시게 발전했지만 언젠가 또 암흑기가 올 수 도 있음. 
  • 아마존의 '에코'가 영어 버전으로서는 가장 발전된 기술을 가지고 있음. (자연어 처리)
  • 자율 주행; 기술은 많이 발전이 되었으나 아직까지는 상용화되지 않고 있음. 

  • 알파고; 바둑은 최적의 솔루션이 있는 문제임. (모든 경우의 수, 하지만 너무 오래 걸림)
  • 361^100은 우주의 원자수보다 큰 숫자이다. 
    • 종이를 50번 접으면(2^50) 달나라를 갈 수 있고 25번 접으면 에베레스트를 간다..
  • 인공지능의 특징
    • 최적의 솔루션을 찾는데 너무 오랜 시간이 걸림
    • 너무 많은 데이터를 필요로 함. 
      1. 빠른 컴퓨터 2. 많은 데이터

  • 예전에 IBM에서 언어학 적으로 접근했다가 번역을 실패함 (인간의 언어가 문법적으로 이루어져있지 않음)

 

인공지능 문제의 접근 방법
  • 알고리즘

  • 하나의 문제에 대해서 문제를 푸는 여러 개의 알고리즘이 있음. 

  • 웹페이지 자체가 얼마나 중요한가
    • formal task형식으로 return한다. 
    • 사람은 feature와 빅데이터를 제공해야 하고, 가중치를 찾아내는 것이 대표적인 머신러닝의 한 방법이다. 

  • 알고리즘과 모델링을 구분해야 한다. 
  • 인공지능
    • 어떤 모델을 사용해야 하는가
    • 인공지능을 빠르게 풀 수 있는 방법 (알고리즘)

  • 단어 하나로 판단

  • 단어 여러개로 판단
  • 단순한 룰이지만 수학적으로 판단하면 가중치를 표현할 수 있음

  • 딥러닝 알고리즘이 복잡한 함수를 이용해서 사용을 한다. 
  • 각각의 뉴런 컴포넌트를 가지고 마지막 최종을 다시 처음과 비교. 

  • 모델 성능이 얼마나 성능이 좋은지 판단을 하는 방법
    • training data를 넣어본다, but 새로운 데이터를 가지고 테스트 하는 것이 더 중요하다. 

  • Reflex모델은 상대적으로 간단한 판단을 한다 (개 고양이 등)

  • 마지막 단어는 artificialintelligence이다. 어떻게 알았는가?

  • 머릿속에서 언어 모델링이 이루어지고 있기 때문이다. 
  • 컴퓨터도 마찬가지로 이런 식으로 학습하게 된다. 
State-based Model
: A state captures all the relevant information about the past in order to act optimally in the future. 
  • 다양한 활용이 있음. 

Variables-Model
  • 호주가 7개의 provinces를 가지고 있는데, 인접한 도를 같은 색깔로 칠하지 않고 3가지 색깔로 칠하려면 몇가지가 필요하겠는가?
  • 미술 전시관에서 3개의 전시품을 전시해야 하는 데 a,b는 같은 방에 들어갈 수 없고, b,c는 같은 방에 들어가야 하고...
    • 우리가 해결해야 하는 이벤트가 있다. 
    • 각각의 이벤트가 들어가는 타임 슬럿에 대한 set이 있다.

  • 센서로 부터 데이터를 읽어서 물체가 이동하는 포지션을 찾는다. 
  • 센서값을 보고 실제 값을 예측하는 모델
Logic-Model
Summary so far
  • binary classificaㅇtion; 둘 중 하나
  • multiclass classification; 많은 것들 중에서
  • Structured 
    • 알고리즘에 넣어주면 새로운 모델을 찾아주고 판단한다. 
    • 머신러닝, 인공지능의 특징은 optimization 한다는 것이다. 

 

  • 공부하는 시간과 성적의 상관관계 w를 알아보자.

  • 가장 바람직한 가중치를 찾아내는 문제

 

Features
  • 사람은 feature와 data를 제공해야 한다. 
  • 사람이 얼마나 feature를 잘 하느냐에 따라서 달라진다. 
  • 조명이나 방향에 따라서도 바뀌지 않는 특징을 알아낸다 
    • 딥러닝은 스스로 이것을 학습한다. 

  • Feature는 관련된 것을 사람이 찾아내서 넣어줘야 한다.(박스안에)
  • feature data를 만드는 것은 사람이 해야 하는 것이다. 
    • 인공지능 알고리즘이 찾아내는 것; weight

  • feature를 define하는 순간, hypothesis class안에서만 찾아낼 수 있다. 
  • 최근의 딥러닝에서는 스스로 이것을 확장하기도 하나, 그것도 어느정도일 뿐이다.

  • 우리에게 주어진 것은 두 대의 자동차의 위치이다.
  • 이 것을 가지고 새로운 linear function을 만들고 이것을 다시 또 넣게 되는 것이다. 

  • 딥러닝, 혹은 뉴럴 네트워크가 하는 것

 

Generalization
  • 사람을 보고 남자인지 여자인지 판단하는 방법
  • 수 많은 feature들의 관계로 이것을 판단하게 된다. 

  • 어떻게 하면 성능을 높일 수 있을까. 
  • 오버피팅을 줄이기 위해서는 모델 성능을 측정하는 방법을 다르게 해야 한다. 

validation set; 모델을 측정하는 데에 쓰이는 set

 

 

Contents

포스팅 주소를 복사했습니다

이 글이 도움이 되었다면 공감 부탁드립니다.