[Tensorflow] 문자 인식용 신경망 Python3 코드

Posted by 적분 ∫2tdt=t²+c
2018.11.14 18:28 프로그래밍/NLP

고문헌의 textualis로 쓰인 글자를 인식하기 위해서 사용한 신경망입니다. https://medium.com/@akashg/character-recognition-using-tensorflow-a93dbbdf4af 코드를 참고하여 작성하였구요, tensorflow와 scikit-learn이 설치되어 있어야 작동합니다.


신경망의 구조는 다음과 같습니다.


INPUT (크기: nImgSize * nImgSize)

  ↓ activation: sigmoid 

LAYER1 (크기: layer1)

  ↓ activation: sigmoid 

LAYER2 (크기: layer2)

  ↓ activation: softmax

OUTPUT (크기: nClasses)


고문헌 라틴어를 인식하는 작업에 imgSize = 32, layer1 = 800, layer2 = 200로 설정하고, 총 100여가지의 문자를 분류해보았는데, 약 91%의 정확도를 보였습니다.





Tensorflow는 정말 간단하면서도 강력한 도구인듯합니다. 이렇게 간단하게 문자인식을 할수 있다니, 확실히 요즘 대세가 되는 이유가 있군요.

이 댓글을 비밀 댓글로
    • semicolon
    • 2019.06.13 18:42
    정확한 사용방법이 이미지 폴더 안에 글자에 알맞는 사진을 넣어서 이미지 학습을 시키는 형식인가요?
    그리고 그렇다면 한글도 넣으면 가능한가요?
    • 네 사용가능하나, 한글의 경우 글자 수가 많아서 모든 종류의 글자를 학습하려면 이 네트워크만 가지고는 비효율적일것 같습니다.
      한글용으로는 다른 기법을 사용하시는게 좋을것 같네요.