STICKY-AI

STICKY-AI

MOBILE : +82.010.7159.4918
E-MAIL : rev.hyeok@gmail.com
GITHUB : https://github.com/sticky-ai

EDUCATION

  • 가천대학교 IT융합대학 IT융합공학과 석사과정 재학 (2018.03 ~ )
    (Master Course, Dept. of IT Convergence Engineering, Gachon Univ.)

  • 가천대학교 공과대학 컴퓨터공학과 학사 졸업 (2011.03 ~ 2018.02)
    (Bachelor’s Degree, Dept. of Computer Engineering, Gachon Univ.)

ABOUT ME

학부에서부터 연구실 생활을 시작하여 데이터 분석 및 기계 학습과 관련된 다양한 활동 및 프로젝트를 경험하였습니다. 프로젝트를 진행하며 10편 이상의 국내외 논문과 포스터를 발표하였으며, 이와 더불어 10건 이상의 국내외 특허 출원 및 등록, SW등록, 기술이전의 성과를 올렸습니다.

외부 활동으로, 데이터 분석에 관심을 가지고 있는 중, 고등학생들에게 R언어 기반의 데이터 분석 교육을 약 1년 간 진행한 경험이 있습니다. 또한, 딥러닝 및 기계학습의 최신 기술들이 실제 제품 및 SW에 어떻게 적용되는지에 대한 호기심을 해결하기 위해 다양한 기관 및 기업에서 개최하는 컨퍼런스 및 심포지움에 참석하여 최신 동향을 파악하는 것을 좋아합니다. 국내 의료분야 최대 규모 학회인 대한의료정보학회에서 주관하는 추계학술대회에 참가하여 ‘Hybird Model for Concentration state classification based on EEG Signal’ 이라는 주제로 논문을 발표하였으며, 우수상을 수상하였습니다. 최근에는 미국 워싱턴 주에서 개최된 AMIA(America Medical Informatics Association) 심포지움에 참석하여 논문 발표를 진행하였습니다.

저의 연구 분야는 당시에 직면한 연구 주제에 따라 바뀌었습니다. 주로 의료 분야에 해당하는 프로젝트를 경험하며 EMR 데이터와 같은 정형 데이터와 의료 영상 혹은 이미지와 같은 비정형 데이터를 모두 경험해보았습니다. 특히, 의료 데이터를 분석하며 어떤 데이터를 사용하느냐, 데이터를 어떻게 사용하느냐에 따라 전혀 다른 방향으로 모델이 구축될 수 있음을 깨달았습니다. ‘쓰레기가 들어가면 쓰레기가 나온다’ 라는 말처럼 모델의 성능은 분석가의 데이터 이해도와 선형성을 띈다고 생각합니다. 따라서, 무엇보다도 분석가가 데이터를 올바르고 정확하게 이해하고 사용하는 것을 최우선적으로 생각합니다.

SKILLS

데이터 분석, 알고리즘 개발, 머신러닝 및 딥러닝 모델 구현에 Python을 사용하고 있습니다. 데이터 분석 시, 통계 관련 라이브러리 및 데이터 시각화를 위해 필요에 따라 R 또한 활용하고 있습니다. 딥러닝계 모델을 구축할 때에는 Tensorflow를 활용합니다.

PROJECT EXPERIENCES

  • 의료 빅데이터 분석 지능형SW 기술 개발 (2018.04 ~ )

    정보통신산업진흥원(NIPA) 주관의 ‘의료 빅데이터 분석 지능형SW 기술개발’ 사업에 참여한 경험이 있습니다. 세부적인 주제는 ‘대장암 치료의사결정지원 SW 개발’입니다. 다시 말해, 병원에서 수집된 EMR 데이터를 기반으로 임상의들이 환자에게 적절한 치료 방법을 권할 수 있도록 도움을 주는 의사결정지원 SW를 개발하는 것이 최종 목표였습니다. 해당 과제에서 AI 기술 기반의 치료의사결정지원 SW 알고리즘을 개발하는 업무를 담당했습니다.

    먼저, 의료 분야와 관련된 프로젝트를 진행하기 위해 대장암 치료와 관련된 전반적인 프로세스과 관련된 전문용어들을 습득하는 것이 무엇보다 중요했습니다. 다른 데이터와는 다르게, 의료 데이터는 데이터를 조금만 다르게 해석해도 전혀 다른 결과를 초래할 수 있으며, 이는 곧 환자의 목숨과 연결되기에 관련 용어를 습득하고, 데이터 전반을 이해하는 데 최우선적으로 노력했습니다. 실제 대장암 환자를 마주하는 대장암 전문의들과의 미팅을 통해 올바른 방향으로 데이터를 이해하고 있는지를 지속적으로 검토하였습니다.

    병원에서 대장암 검진을 받는 인원 중 실제 대장암으로 진단받는 경우는 극히 드물게 발생하기 때문에, 데이터가 편향된 상태로 전달됩니다. 따라서, 이러한 데이터 불균형 문제를 해결하기 위해 많은 노력을 기울였습니다. 전통적인 데이터 샘플링 방법부터, 머신러닝 기반의 데이터 오버샘플링 기법, 딥러닝 기반의 데이터 오버샘플링 기법까지 많은 시행착오를 거쳤습니다. 최근 GAN(Generative Adversarial Nets) 알고리즘이 이미지 오버샘플링에 사용되는 것에서 영감을 받아 GAN 알고리즘을 기반으로 정형 데이터를 오버샘플링하여 데이터 불균형 문제를 해결하고자 하였으며, 기존 샘플링 방법을 사용했을 때 보다 더욱 향상된 결과를 얻을 수 있었습니다.

  • 임상시험 매칭을 위한 알약 이미지 분류 기술 개발 (2018.12 ~ 2019.12)

    병원에서는 치료 방법 및 의약품의 효과를 확인하기 위해 다양한 임상실험을 필요로 합니다. 조건에 맞는 임상시험자를 찾는 과정에서 중요하게 작용하는 조건 중 하나는 환자가 복용 중인 알약의 종류입니다. 복용중인 알약의 종류에 따라 참여 가능한 또한 불가능한 임상시험이 구분되기에 환자가 복용하는 알약을 파악하는 것은 필수적입니다. 대부분의 환자는 꾸준히 알약을 복용중이지만, 본인이 복용하고 있는 알약의 정확한 이름을 알고 있는 경우는 거의 없습니다. 따라서, 이러한 문제점을 해결하기 위해 사용자가 복용하고 있는 알약의 이미지를 업로드하면 어떠한 알약을 복용 중인지 판별하는 알약 이미지 분류 모델을 구축하는 역할을 수행했습니다.

  • 의료 빅데이터를 활용한 뇌질환 예측 및 예방 기술 개발 (2017.07 ~ 2020.02)

    정보통신기획평가원(IITP)이 주관하는 ‘의료 빅데이터를 활용한 뇌질환 예측 및 예방’ 사업에 참여한 경험이 있습니다. 전체 사업 중 ‘뇌질환 위험도 예측 및 분류’라는 주제의 세부 과제를 담당하여 진행하였습니다. 해당 과제에서 뇌질환(치매, ADHD, 우울증) 데이터를 기반으로 위험도를 예측하고 위험군과 비위험군을 분류하는 모델을 구축하는 역할을 담당하였습니다.

    병원에서 제공되는 별도의 뇌질환 관련 데이터가 없었기 때문에, 오픈 데이터를 활용하여 모델을 구축해야 했습니다. 하지만, 목적에 맞는 오픈 데이터를 찾기가 쉽지 않았기 때문에 직접 데이터를 수집하는 것이 더 빠르다고 판단하였습니다. 따라서, 데이터 수집을 위해 직접 실험을 설계하고, 각 연령층 별로 10명의 실험군을 상대로 질환 데이터 수집 실험을 진행하여 자체적인 데이터를 확보하였습니다.

    모델 구축 과정에서 뇌질환 위험도를 보다 객관적으로 측정할 수 있도록 기존 레퍼런스 자료(논문, 임상의 자문)를 취합하여 자체적인 뇌파(알파파, 베타파, 세타파) 기반의 뇌질환 위험도 측정 지표를 개발하였으며, 해당 지표를 기반으로 환자 데이터를 뇌질환 위험군 및 비위험군으로 구분하였으며, 해당 클래스를 기반으로 뇌질환 분류 모델을 구축하였습니다.

QUANTITATIVE OUTCOME

Paper

  • DNN-based epilepsy EEG system for classification of epilepsy patients, Korean Institute of Information Scientists and Engineers, 2019
  • Imagery signal-based deep learning method for prescreening major depressive disorder, ICCC 2019:Cognitive Computing, 2019
  • Super learning ensemble technique for classifying breast cancer, Health Informatics Journal, 2019
  • A learning attention improvement system based on neurofeedback, Journal of Engineering and Applied Sciences, 2018
  • A research of calculating attention concentration considering visual waves on concentration, The Korean Society of Medical Informatics, 2018
  • The effect of binaural beat-based audiovisual stimulation on brain waves on concentration, The Korean Institute of communications and Information sciences, 2018
  • Hybird model for concentration state classification based on EEG signal, Journal of Korea Society of Computer and Information, 2018
  • Design of user concentration classification model by EEG analysis based on visual SCPT, Journal of Korea Society of Computer and Information, 2018
  • Big data analysis of stress on adolescent mental health, Journal of Korea Society Computer and Information, 2017

Poster

  • Improving clinical decision support system by analyzing prognostic factors of colorectal cancer stage IV patients, AMIA 2019 Annual Symposium, 2019
  • An ensemble algorithm model for the diagnosis of colorectal cancer based on machine learning, 39th Congress of the European Society of Surgical Oncology, 2019
  • Improving clinical decision support system by analyzing risk factors of recurrence of colorectal cancer patients, Korean Society of Artificial Intelligence in Medicine, 2019
  • Evaluation of diagnosis model for colorectal cancer by feature selection method : using PLCO dataset, The Korean Society of Coloproctology, 2019
  • Diagnosis model for colorectal cancer based on machine learning : using PLCO dataset, SISSO 2019 : Seoul International Symposium of Surgical Oncology, 2019

Patent

  • 청각 자극을 통한 주의집중력 강화 시스템 및 방법, 10-2018-0081430, 2019
  • 다중감각을 활용한 주의집중력 강화 시스템, 10-2018-0140252, 2019
  • 집중력 강화를 위한 이미지트레이닝용 장갑 모듈 시스템, 10-2018-0145516, 2019
  • 텍스트마이닝을 이용한 뇌질환 연구 보조 시스템, 방법 및 컴퓨터-판독가능 매체, 10-2019-0086161, 2019
  • 사용자 뇌질환 질단 방법, 시스템 및 컴퓨터-판독가능 매체, 10-2019,0158002, 2019
  • ANT 기반 맞춤형 학습 집중력 향상 시스템 및 방법, 10-2017-0164942, 2018
  • 대장암 임상 의사결정지원 시스템 및 방법, 10-2018-0123966, 2018
  • EEG 기반 학습집중력파 검출 장치 및 방법, 10-2017-0164952, 2017

SW Registration

  • 뇌질환 임상의사결정지원 SW, C-2019-020207, 한국저작권위원회, 2019
  • 뇌파 이미지를 이용한 우울증 사전 진단 시스템, C-2019-032863, 한국저작권위원회, 2019
  • 대장암 치료 EMR 기반 데이터 밸런싱 및 재발 예측 모델, C-2019-035270, 한국저작권위원회, 2018
  • 머신러닝 기반 뇌질환 분류 분석, C-2018-031433, 한국저작권위원회, 2018
  • 대장암 치료를 위한 의사결정지원 SW, C-2018-033399, 한국저작권위원회, 2018

Technology Transfer

  • EEG 기반 학습집중력파 검출 장치 및 방법, Logibros
  • ANT 기반 맞춤형 학습집중력 향상 시스템 및 방법, Logibros

ACTIVITIES

  • Researcher : Gachon Bigdata Research Association (2018.07 - 2018.12)
  • Paticipant : Global Entrepreneurship Korea Camp (2018.05 - 2018.06)
  • R/Python Teaching Assistant : Gyeong-gi University of Dreams (2017.08 - 2017.09)
  • R/Python Teaching Assistant : Instititue for Scientifically Able Youth of Gachon University (2017.07 - 2018.01)
  • Honorary Ambassador : Journal of Korea Society of Medical Informatics (2017.07 - 2017.12)
  • Participant/Leader : Bigdata Learning Community (2017.04 - 2017.07)