2015 1학기부터

일반대학원 석사과정에 데이터사이언스학과(Department of Data Science)를 신설하고

신입생을 모집하니 많은 관심 바랍니다.

 

단국대학교 대학원

데이터사이언스학과 (석사과정)

 

1. 학과, 전공, 학위

 

- 학과명: 데이터사이언스학과 (Department of Data Science)

- 설치 과정: 석사과정

- 전공명: 데이터사이언스 전공 (Major in Data Science)

- 수여 학위명: ·영문 학위명은 데이터사이언스 석사: Master of Science (Data Science)”이며 영문약어는 데이터사이언스 석사(MS in Data Science)로 표시됨.

 

2. 학과 소개

 

(1) 학과 개요

단국대학교 일반대학원 데이터사이언스학과20149월에 학과 신설이 승인되어 20153월에 첫 신입생을 모집할 예정임. 본 학과는 20145월에 SAP, 경기도, 단국대학교가 공동으로 Big Data 전문인력 양성을 위해 체결한 MOU를 기반으로 하고 있음.

데이터사이언스학과는 데이터의 분석과 처리 기술에 대한 심층 연구와 인재 양성을 통하여 현재 수요가 급증하고 있는 '데이터 과학자'의 육성을 목표로 관련 학문 분야의 이론적 지식과 실무를 습득할 수 있도록 전공 교수진을 구성하여 데이터 기반의 인사이트와 가치를 창출하는 미래 지향적인 교육 과정을 운영하고 있음. 데이터사이언스학과는 컴퓨터학, 통계학의 데이터 관리 및 분석 기술과 경영학 전반에 걸친 비즈니스마인드를 기반으로 SAP의 실무 중심 기술을 반영하여 사회 전분야에 융합 적용이 가능한 교육과정을 구성함으로써, 학부에서 컴퓨터학, 소프트웨어학, 통계학, 경영학, 경제학 등 관련 전공을 전공한 학생들 뿐 아니라 데이터 분석 기반의 융합 연구에 관심을 갖고 있는 학생들도 지원이 가능하도록 하여 데이터 과학의 발전에 필요한 우수 인재들의 양성에 기여할 예정임.

 

(2) 데이터사이언스 개요

데이터 사이언스는 컴퓨터공학의 데이터베이스, 데이터 마이닝 기술, 인공 지능 분야의 기계 학습, 패턴 인식, 영상 처리 기술, 통계학의 회귀 분석 기술, 사회 분석 기술 등이 종합적으로 모여서 완성이 되는 융합적인 성격의 학문이라고 할 수 있음.

데이터 사이언스 분야에서는 이러한 학제간 기술을 기반으로 위성의 원격 관측 데이터, 우주 망원경의 전송 사진, 유전체 표현 마이크로어레이 데이터, 과학 시뮬레이션 데이터, 금융권의 은행 거래 및 신용카드 트랜잭션 데이터, 유통업의 장바구니 트랜잭션 데이터, 정보시스템의 웹 로그 및 데이터베이스 로그 데이터 등을 체계적으로 분석하여 조직의 경쟁력 강화에 도움이 되는 유용한 정보, 패턴, 지식을 발견하는 과학적인 방법을 연구하고 있음.

 

(3) 학과 운영 방안

- SAP Korea와 공동으로 운영함. SAP은 빅데이터 관련 플랫폼(SAP Hana 플랫폼)을 제공하고 현장밀착형 교육에 필요한 컨텐츠 및 강사를 제공할 예정임.

- 석사 학위 취득자의 경우 SAP과의 공조 협력을 통해 데이터 분석 관련 글로벌 회사, 국내외 회사로 취업 연결 (추진 예정)

- 한국데이터베이스진흥원의 데이터 분석 전문가(ADP: Advanced Data Analytics Professional) 자격증 취득을 권장함.

 

3. 교육과정

 

이수구분

교과목

비고

전공과목

(SAP연계)

경영정보시스템 (Management Information System)

전사적 자원관리론 (Enterprise Resource Planning)

경영의사결정론 (Business Decision Making)

컴퓨터 프로그래밍 (Computer Programming)

데이터베이스 (Databases)

유닉스/리눅스 (Unix/Linux)

선형통계분석(Linear Statistical Analysis)

 

전공과목

(기반기술)

데이터베이스 관리 (Database Management)

분산 시스템 (Distributed Systems)

정보 검색 (Information Retrieval)

클라우드 컴퓨팅 (Cloud Computing)

빅데이터 처리 (Big Data Processing)

하둡 프로그래밍 (Hadoop Programming)

자연어 처리 (Natural Language Processing)

지식 표현과 모델링 (Knowledge Representation and Modeling)

인공 지능 응용 (Artificial Intelligence Application)

개인정보 보호 (Information Privacy)

센서 네트워크 (Sensor Networks)

이미지 처리와 인식 (Image Processing and Recognition)

인간-컴퓨터 상호작용 (Human-Computer Interaction)

경영최적화이론 (Business Optimization Theory)

 

전공과목

(분석기술)

데이터 분석 및 기획 (Data Analysis and Planning)

데이터 마이닝 (Data Mining)

소셜 네트워크 마이닝 (Social Network Mining)

기계 학습 (Machine Learning)

다변량통계분석(Multivariate Statistical Analysis)

빅데이터 마케팅 (Big Data Marketing)

R 프로그래밍 (R Programming)

Hana 기술 응용 (Application of Hana Technology)

시각화 기법 (Visualization Techniques)

데이터 분석 사례 연구 (Data Analysis Case Study)

데이터 분석 프로젝트 (Data Analysis Project)

 

연구지도

연구지도 세미나 I (Research Seminar I)

연구지도 세미나 II (Research Seminar II)

연구지도 세미나 III (Research Seminar III)

 

 

 

전공과목(SAP연계과목) 개요

 

경영정보시스템 (Management Information System): 경영정보시스템의 개념 및 구조, 계획, 개발 및 운영, 평가 및 통제 등 경영프로세스 전반에 관하여 학습하고 e-Business를 구성하는 CRM, ERP, SCM 등의 개념들도 소개한다.

전사적 자원관리론 (Enterprise Resource Planning): 1세대 ERP의 개념, Extended ERP 확장 및 발전방향과 범위에 관하여 학습하고 이에 관련된 경영의사결정 프로세스의 정의와 분석을 수행하며, ERP 프로젝트 시행 전략수립, 솔루션의 선택, 도입방법론과 사례에 관하여 학습한다.

경영의사결정론 (Business Decision Making): 의사결정나무, 민감도분석, 기대효용모형, 다기준 의사결정, 시뮬레이션 등의 분석적 기법들을 중심으로 학습함으로써 경영의사결정에서 직면하는 최적의 대안을 선택하는 과정을 이론과 실습을 병행하며 진행한다.

컴퓨터 프로그래밍 (Computer Programming): C, C++, Java 등을 중심으로 컴퓨터를 이용한 프로그래밍 기법을 소개한다.

데이터베이스 (Databases): 데이터베이스의 기초 개념, E-R 모델링, 관계 데이터 모델, 정규화 이론, SQL 언어, 데이터베이스 설계 기법 등에 대하여 소개한다.

유닉스/리눅스 (Unix/Linux): UNIX, Linux 운영체제의 구조, 프로세스 스케줄링 기법, 메모리 관리 기법, 파일 시스템 등에 대하여 소개한다.

선형통계분석(Linear Statistical Analysis): 데이터의 분석에 많이 활용되고 있는 다양한 형태의 선형모형의 설정, 모수에 대한 추정 및 검정방법을 학습한다. 주요 학습내용으로 회귀분석과 실험계획법 등이 있다.

 

전공과목(기반 기술) 개요

 

데이터베이스 관리 (Database Management): 데이터베이스의 주요 개념, 질의 최적화 기법, 병행 제어 기법, 회복 기법, 보안 기법, 분산 데이터베이스, 객체지향 데이터베이스, 문서 데이터베이스 기술 등을 소개한다.

분산 시스템 (Distributed Systems): 대용량 데이터의 분산 병렬 처리를 위한 분산 컴퓨팅 구조 및 기술, 분산 프로그래밍 기술, 분산 데이터베이스 기술, 병렬 처리 기술 등을 소개한다.

정보 검색 (Information Retrieval): Google, Yahoo, Naver 등의 검색 엔진을 구축하기 위한 요소 기술들을 소개한다. 정보 검색의 전체 절차, 형태소 분석 기술, 스테밍 기법, 역 인덱스 구축, 질의 처리 기술, 랭킹 기법 등을 소개한다.

클라우드 컴퓨팅 (Cloud Computing): 서버, 스토리지, 네트워크, 소프트웨어 등의 컴퓨팅 자원을 공유 풀로 유지하여 필요한 시점에 필요한 만큼 원격 네트워크를 통해서 편리하게 제공하는 온디맨드(on demand) 컴퓨팅 방식인 클라우드 컴퓨팅 기법의 주요 기술과 개념에 대하여 소개한다. Amzaon, MS, KT 등의 주요 클라우드 서비스 제공자의 서비스 방식에 대해서도 살펴본다.

빅데이터 처리 (Big Data Processing): 페타급, 엑사급의 빅데이터 처리를 위한 분산 병렬 컴퓨팅 플랫폼과 처리 기술을 소개한다. Google 컴퓨팅 플랫폼, Hadoop 컴퓨팅 플랫폼, Google File System, Hadoop Distributed File System, MapReduce Programming, Google BigTable, Hadoop HBase 등에 대해 소개한다.

하둡 프로그래밍 (Hadoop Programming): Hadoop 플랫폼을 이용하여 분산 컴퓨팅 클러스터를 구축하고 Hadoop 분산 파일 시스템과 MapReduce 기법을 이용하여 데이터를 분산 처리하는 프로그래밍 기법을 배운다.

자연어 처리 (Natural Language Processing): 텍스트 데이터에서 분석할 키워드를 추출하기 위한 자연어 처리 기법을 소개한다. 자연어 문장에 대한 형태소 분석, 파싱, 변환 기법 등을 소개한다.

지식 표현과 모델링 (Knowledge Representation and Modeling): 지식구조는 어떤 특정한 주제에 대한 사실과 지식 상호 관계의 집합체이며, 개념과 개념 상호 간에 명명된관계에 의해서 형성된다. 이 과목에서는 시맨틱 웹을 지식의 원천으로 XML, RDF, 그리고 온톨러지를 사용하여 지식구조를 모델링하는 것을 다룬다.

인공 지능 응용 (Artificial Intelligence Application): 문맥 인지(context awareness) 기술, 추천자 시스템(recommender systems) 등에 대해 소개한다.

개인정보 보호 (Information Privacy): 데이터 분석에서 이슈가 되는 개인정보의 보호 기술, 인증 기술, 암호화 기법 등에 대해 소개한다.

센서 네트워크 (Sensor Networks): 데이터의 수집에 핵심적인 역할을 하는 센서 기술, 센서 네트워크, 유비쿼터스 센서 네트워크, RFID 기술, IoT(Internet of Thing) 기술 등을 소개한다.

이미지 처리와 인식 (Image Processing and Recognition): 영상을 분석하여 패턴을 인식하기 위한 주요 기술을 소개한다. 영상 처리, 신호 처리, 패턴 인식 기술 등을 소개한다.

인간-컴퓨터 상호작용 (Human-Computer Interaction): 인간-컴퓨터 상호작용의 이론과 실제를 익히며, 인간 의사결정에 대한 컴퓨터에 의한 지원을 강조한다. 인지과학, 정보설계, 인간공학 등의 측면에서의 원리적 지식을 습득케 한 후, 태스크 기반 설계 방법, 인지적 태스크 분석방법, 인간전략 분석, 정보 지원 및 시각화 등의 개별적 주제를 다룬다.

경영최적화이론 (Business Optimization Theory): 비즈니스 환경하에서 기업이 당면한 의사결정 문제를 수리적으로 모형화하기 위해 필요한 기본 개념을 설명한다. 또한 선형계획법, 정수계획법, 동적계획법, 시뮬레이션 등 다양한 최적화 기법에 대한 학습을 통해 모형화에 필요한 조건을 규명하고 수리적 분석을 획득한 결과를 해석을 할 수 있는 역량을 증진시키는데 중점을 둔다.

 

전공과목(분석 기술) 개요

 

데이터 분석 및 기획 (Data Analysis and Planning): 데이터의 분석을 위한 전체적인 절차를 기획하고 준비하는 기법들을 소개한다.

데이터 마이닝 (Data Mining): 데이터 마이닝은 방대한 양의 데이터로부터 유용한 지식을 발견하는 데 중요한 역할을 한다. 본 과목에서는 데이터 마이닝의 기본적인 개념들과 기법들을 가르친다. 좀 더 세부적으로 빈발 패턴 및 연관성, 분류및 예측, 클러스터 분석이 다뤄진다. 본 과목의 주요 목표는 특정 분야에 국한되지 않고 다양한 데이터 마이닝 기법들에 대한 개괄적인 지식을 가르치는 데 있다.

소셜 네트워크 마이닝 (Social Network Mining): 온라인 소셜 네트워크의 등장은 금세기 가장 흥미로운 사건중의 하나로 꼽힌다. Twitter, Facebook, LinkedIn과 같은 수많은 온라인 소셜 네트워크들이 급속도로 보편화되고 있다. 일반적으로 이러한 소셜 네트워크들은 분석에 활용될 수 있는 엄청난 양의 내용 및 링크 데이터를 포함하고 있다. 본 과목은 데이터 마이닝 관점에서 온라인 소셜 네트워크를 분석하기 위한 주요 개념 및 알고리즘들을 가르친다.

기계 학습 (Machine Learning): 신경 회로망, HMM(히든 마르코프 모델), 유한 오토마타 이론 등 주요 기계 학습 기법들을 소개한다.

다변량통계분석(Multivariate Statistical Analysis): 다변량 데이터분석을 통해 데이터의 구조를 명확하게 이해하고 단순하게 요약하는 통계적 방법에 대해 학습한다. 또한, 비즈니스 데이터를 활용한 실습을 통해 다양한 다변량 데이터 분석법을 언제 어떻게 활용하는가에 대한 근본적인 이해를 도모한다. 다변량 정규분포, 다변량 선형모형, 주성분분석, 인자분석, 정준상관분석, 판별분석, 군집분석 등을 학습한다.

빅데이터 마케팅 (Big Data Marketing): 데이터를 활용해 고객별로 차별화된 가치를 제공하는 빅데이터 마케팅 기법을 소개한다. 과학과 예술이 만나는 빅데이터 마케팅의 개념, 마케팅 관리자들이 알아야 하는 데이터 중심의 마케팅 전략들을 소개한다.

R 프로그래밍 (R Programming): 본 과목에서는 데이터 분석용 객체지향 프로그래밍 언어인 R을 다룬다. R커맨더, Rattle, Red-R, R스튜디오, R엑셀 등 다양한 R 패키지를 활용하여 데이터 구조, 입력 처리, 데이터객체의 처리, 기초 프로그래밍, 행렬 표현과 연산, 그래픽, 통계함수를 이용한 데이터 분석 등을 교육한다.

Hana 기술 응용 (Application of Hana Technology): SAP HANA 플랫폼의 주요 구성 기술, HANA를 기반으로 한 데이터 분석 기술을 소개한다.

시각화 기법 (Visualization Techniques): 데이터와 데이터간의 관계를 분석하고 보고하기 위해 데이터를 시각적인 형태 또는 표 형태로 변환하는 기법을 소개한다. 적은 수의 속성을 갖는 데이터, 시공간적인 데이터, 고차원 데이터 등의 시각화에 적합한 기법들을 소개한다.

데이터 분석 사례 연구 (Data Analysis Case Study): 의학, 약학, 생명과학, 우주 천문학, 기상학, 경영학, 경제학, 마케팅, 금융공학, 행정학, 재난관리 등 다양한 학문 분야에서 빅데이터를 활용한 프로젝트의 성공적 적용 사례를 분석한다.

데이터 분석 프로젝트 (Data Analysis Project): 데이터를 분석할 특정 도메인을 선정하여 팀을 구성하고 데이터 처리 플랫폼과 분석 도구를 이용하여 실제 데이터를 분석하는 실무적인 프로젝트를 진행한다.

 

4. 참여 교수진

 

나연묵 (공과대학 응용컴퓨터공학과 데이터베이스 전공)

황창하 (사회과학대학 응용통계학과 통계학 전공)

이기광 (상경대학 경영학부 경영과학 전공)

박규식 (공과대학 소프트웨어학과 영상처리 전공)

방성일 (공과대학 전자공학과 통신공학 전공)