바로가기메뉴

본문 바로가기 주메뉴 바로가기

logo

  • P-ISSN1013-0799
  • E-ISSN2586-2073

토픽 모델링 기반 내용 분석을 통한 학제 간 융합기술 도출 방법

Discovering Interdisciplinary Convergence Technologies Using Content Analysis Technique Based on Topic Modeling

정보관리학회지, (P)1013-0799; (E)2586-2073
2018, v.35 no.3, pp.77-100
https://doi.org/10.3743/KOSIM.2018.35.3.077
정도헌 (덕성여자대학교)
주황수 (덕성여자대학교)

  • 다운로드 수
  • 조회수

초록

본 연구는 텍스트 마이닝 기법을 활용하여 대량의 데이터로부터 학제 간 융합 기술을 발굴하는 일련의 과정을 제시하는 것을 목표로 한다. 바이오공학 기술(BT) 분야와 정보통신 기술(ICT) 분야 간의 융합 연구를 위해 (1) BT 분야의 기술용어 목록을 작성하여 대량의 학술논문 메타데이터를 수집한 후 (2) 패스파인더 네트워크 척도 알고리즘을 이용해 유망 기술의 지식 구조를 생성하고 (3) 토픽 모델링 기법을 사용하여 BT분야 중심의 내용 분석을 수행하였다. 다음 단계인 BT-ICT 융합 기술 아이템 도출을 위해, (4) BT-ICT 관련 정보를 얻기 위해 BT 기술용어 목록을 상위 개념으로 확장한 후 (5) OpenAPI 서비스를 이용하여 두 분야가 관련된 학술 정보의 메타데이터를 자동 수집하여 (6) BT-ICT 토픽 모델의 내용 분석을 실시하였다. 연구를 통해 첫째, 융합 기술의 발굴을 위해서는 기술 용어 목록의 작성이 중요한 지식 베이스가 된다는 점과 둘째, 대량의 수집 문헌을 분석하기 위해서는 데이터의 차원을 줄여 분석을 용이하게 해주는 텍스트 마이닝 기법이 필요하다는 점을 확인하였다. 본 연구에서 제안한 데이터 처리 및 분석 과정이 학제 간 융합 연구의 가능성이 있는 기술 요소들을 발굴하는 데 효과적이었음을 확인할 수 있었다.

Abstract

The objectives of this study is to present a discovering process of interdisciplinary convergence technology using text mining of big data. For the convergence research of biotechnology(BT) and information communications technology (ICT), the following processes were performed. (1) Collecting sufficient meta data of research articles based on BT terminology list. (2) Generating intellectual structure of emerging technologies by using a Pathfinder network scaling algorithm. (3) Analyzing contents with topic modeling. Next three steps were also used to derive items of BT-ICT convergence technology. (4) Expanding BT terminology list into superior concepts of technology to obtain ICT-related information from BT. (5) Automatically collecting meta data of research articles of two fields by using OpenAPI service. (6) Analyzing contents of BT-ICT topic models. Our study proclaims the following findings. Firstly, terminology list can be an important knowledge base for discovering convergence technologies. Secondly, the analysis of a large quantity of literature requires text mining that facilitates the analysis by reducing the dimension of the data. The methodology we suggest here to process and analyze data is efficient to discover technologies with high possibility of interdisciplinary convergence.

참고문헌

1

강태규. (2009). 녹색성장 LED 융합 기술 동향 분석. 전자통신동향분석, 24(5), 30-37.

2

과학기술정책연구원. (2011). 사회문제 해결을 위한 과학기술-인문사회 융합방안. STEPI.

3

박지호. (2011). 위성항법시스템과 비전시스템 융합 기술 기반의 신뢰성있는 위치 측위에 관한 연구. 전자공학회논문지 - TC, 48(10), 20-28.

4

백현미. (2013). 특허 네트워크 분석을 통한 융합 기술 트렌드 분석: 한국·미국·유럽·일본의 특허데이터를 중심으로. 벤처창업연구, 8(2), 11-19. http://dx.doi.org/10.16972/apjbve.8.2.201306.11.

5

산업연구원. (2014). 한국의 기술융합 발전 트렌드 및 융합기술개발 결정요인 분석. 산업연구원.

6

생명공학정책연구센터. (2015). 2015 바이오 미래유망기술 - ICT융합 바이오헬스 10대 미래유망기술 -.

7

생명공학정책연구센터. (2017). 2017 바이오 미래유망기술 - 바이오헬스 이슈를 선도하는 10대 미래유망기술 -.

8

생명공학정책연구센터. (2018). 2018 바이오 미래유망기술 - Core, Red, Green, White Bio로 살펴본 10대 미래유망기술 -.

9

육지희. (2018). 토픽모델링과 딥 러닝을 활용한 생의학 문헌 자동 분류 기법 연구. 정보관리학회지, 35(2), 63-88. http://dx.doi.org/10.3743/KOSIM.2018.35.2.063.

10

정도헌. (2017). 자동 분류 기법과 지적 구조 분석 기법을 융합한 처방적 분석 시스템 구현 방안 연구. 정보관리학회지, 34(4), 33-57. http://dx.doi.org/10.3743/KOSIM.2017.34.4.033.

11

조아. (2015). LDA 기법을 이용한 버스 승객의 잠재적 이동패턴 분석. 한국데이터정보과학회지, 26(5), 1061-1069. http://dx.doi.org/10.7465/jkdi.2015.26.5.1061.

12

진설아. (2016). 토픽 모델링 기반 정보학 분야 학술지의 학제성 측정 연구. 정보관리학회지, 33(1), 7-32. http://dx.doi.org/10.3743/KOSIM.2016.33.1.007.

13

최호창. (2018). 기술 성숙도 및 의존도의 네트워크 분석을 통한유망 융합 기술 발굴 방법론. 지능정보연구, 24(1), 101-124. http://dx.doi.org/10.13088/jiis.2018.24.1.101.

14

Blei, D. M.. (2003). Latent dirichlet allocation. The Journal of Machine Learning Research, 3, 993-1022.

15

Ouriel Caen. (2017). Microfluidics as a Strategic Player to Decipher Single-Cell Omics?. Trends in Biotechnology, 35(8), 713-727. http://dx.doi.org/10.1016/j.tibtech.2017.05.004.

16

Deerwester, S.. (1990). Indexing by latent semantic analysis. Journal of the American Society of Information Science, 41(6), 391-407.

17

Farrahi, K.. (2012). Extracting mobile behavioral patterns with the distant N-gram topic model (1-8). Proceedings of the 16th International Symposium on Wearable Computers (ISWC).

18

Jacques Galipeau. (2018). Mesenchymal Stromal Cells: Clinical Challenges and Therapeutic Opportunities. Cell Stem Cell, 22(6), 824-833. http://dx.doi.org/10.1016/j.stem.2018.05.004.

19

Gartner. (2015). Are wearables fit for clincal trials?. http://www.gartner.com/smarterwithgartner/are-wearables-fit-for-clinical-trials/.

20

Gartner. (2017). Gartner says worldwide wearable device sales to grow 17 percent in 2017. newsroom press release. http://www.gartner.com/en/newsroom/press-releases/2017-08-24-gartner-says-worldwide-wearable-device-sales-to-grow-17-percent-in-2017.

21

Gartner. (2018). Wearables hold the key to connected health monitoring. smarter with gartner. http://www.gartner.com/smarterwithgartner/wearables-hold-the-key-to-connected-health-monitoring/.

22

Hofmann, T.. (1999). Probabilistic latent semantic indexing (50-57). Proceedings of the 22nd annual international ACM SIGIR conference on Research and development in information retrieval.

23

Do-Heon Jeong. (2014). Time gap analysis by the topic model-based temporal technique. Journal of Informetrics, 8(3), 776-790. http://dx.doi.org/10.1016/j.joi.2014.07.005.

24

Sung Yong Jung. (2012). In vivo measurements of blood flow in a rat using X-ray imaging technique. The International Journal of Cardiovascular Imaging, 28(8), 1853-1858. http://dx.doi.org/10.1007/s10554-012-0029-1.

25

Hwa-Yong Lee. (2017). Double-edged sword of mesenchymal stem cells: Cancer-promoting versus therapeutic potential. Cancer Science, 108(10), 1939-1946. http://dx.doi.org/10.1111/cas.13334.

26

McKinsey Global Institute. (2011). Big data: The next frontier for innovation, competition, and productivity. http://www.mckinsey.com/business-functions/digital-mckinsey/our-insights/big-data-the-next-frontier-for-innovation.

27

MIT. (2015). MIT technology review, 10 breakthrough technologies, 2015. http://www.technologyreview.com/lists/technologies/2015/.

28

Sanjay M. Prakadan. (2017). Scaling by shrinking: empowering single-cell 'omics' with microfluidic devices. Nature Reviews Genetics, 18(6), 345-361. http://dx.doi.org/10.1038/nrg.2017.15.

29

Arnaud Quirin. (2008). A quick MST-based algorithm to obtain Pathfinder networks (∞, n − 1). Journal of the American Society for Information Science and Technology, 59(12), 1912-1924. http://dx.doi.org/10.1002/asi.20904.

30

Research and Markets. (2017). mHealth (Mobile Healthcare) Ecosystem Market: 2017-2030-$23 Billion Opportunities, Challenges, Strategies & Forecasts. http://globenewswire.com/news-release/2017/03/02/930109/0/en/mHealth-Mobile-Healthcare-Ecosystem-Market-2017-2030-23-Billion-Opportunities-Challenges-Strategies-Forecasts.html.

31

Sarah M. Ridge. (2017). Mesenchymal stem cells: key players in cancer progression. Molecular Cancer, 16(1), -. http://dx.doi.org/10.1186/s12943-017-0597-8.

32

Salton, G.. (1983). Introduction to Modern Information Retrieval:McGraw-Hill(NY).

33

Schvaneveldt, R. W.. (1989). The psychology of learning and motivation: Advances in research and theory, 24:Academic Press.

34

Min Song. (2013). Detecting the knowledge structure of bioinformatics by mining full-text collections. Scientometrics, 96(1), 183-201. http://dx.doi.org/10.1007/s11192-012-0900-9.

36

Nicholas Vretos. (2012). Video fingerprinting using Latent Dirichlet Allocation and facial images. Pattern Recognition, 45(7), 2489-2498. http://dx.doi.org/10.1016/j.patcog.2011.12.022.

37

George M. Whitesides. (2001). Soft Lithography in Biology and Biochemistry. Annual Review of Biomedical Engineering, 3(1), 335-373. http://dx.doi.org/10.1146/annurev.bioeng.3.1.335.

38

Wikipedia. (2018). Wikipedia(2018). Disruptive Innovation. Retrieved from. http://en.wikipedia.org/wiki/Disruptive_innovation.

정보관리학회지