박사 과정을 마치면서, 그동안 했던 연구 및 앞으로의 계획에 대해 발표할 기회가 종종 주어집니다. 올해 초에 Job Talk이 있었고, 최근에 한국에서도 제 연구에 대한 한 시간 분량으로 소개할 자리가 있었습니다. 오늘은 그 행사에서 썼던 발표자료와 동영상을 공유할까 합니다. 원래 한글로 발표할 계획이었습니다만, 청중 가운데 외국인이 계서서 영어로 진행하였습니다.


저의 발표는 '검색'이라는 분야 및 저의 주요 연구내용, 그리고 앞으로의 트렌드에 대한 전망으로 마무리됩니다. 대부분 검색 연구경험이 없는 학생들을 대상으로, 한 시간동안 진행한 발표라, 전체적으로 기술적인 내용을 깊게 다루지는 않습니다. 하지만, 검색 연구가 어떤 식으로 진행되는지에 대한 감을 드리는 차원에서, 저의 논문중 구조화된 문서의 검색에 사용되는 검색모델에 대해 (PRM-S / FRM) 자세히 설명합니다. 


발표자료는 아래 SlideShare에서 보실 수 있지만, 중간중간 삽입된 애니메이션이 제대로 보이지 앖기 때문에, 여기서 다운로드 받으실 것을 권장합니다.


위에서 주최측에서 준비해주신 발표 동영상을 보실수도 있습니다. 조금 어둡게 쵤영되기는 했지만, 내용 전달에 큰 무리는 없으리라 봅니다. HD버튼을 누르시면 훨씬 더 선명한 영상을 보실 수 있습니다.


아직 갈길이 멀지만, 배움의 여정 중간중간 이렇게 그동안의 여정을 공유할 자리가 있다는 것은 감사한 일입니다. 자료를 보시고 더 궁금하신 내용이나, comment가 있으신 분은 답글로 남겨주시면 감사하겠습니다. ^^


지난주에는 시애틀에서 열린 WSDM학회에 다녀왔습니다. WSDM은 올해로 5회째를 맞는 젊은 학회이지만, 비교적 적은 양의 논문을 Single Track 형식으로 발표하여, 참가자들간의 활발한 소통이 이루어지는 것이 특징인 학회입니다. 저에게는 작년 여름의 인턴 프로젝트 및 연구실에서 공저한 논문을 발표하고, 진로 모색을 위해 사람들을 만나는 자리였습니다. 학회 일정을 돌아보며 배운 점을 기록하고, 마지막에 주간 리뷰를 적어볼까 합니다 ;)

Doctoral Symposium 
Doctoral Symposium은 학위과정에 있는 대학원생들이 논문 주제에 대해 발표하고 학계 Senior들의 의견을 들을 수 있는 자리입니다. 논문을 마쳐가는 저같은 사람보다는 한창 진행중인 학생들을 위한 자리이지만, 오후에 열리는 Career Workshop에서 연구 및 진로에 대해 학계 및 산업계 종사자인 패널의 다양한 의견을 들을 수 있었습니다. 

우선 흥미있었던 주제는 Engineering, Applied Science, Basic Science의 경계에 관한 것이었습니다. 과학은 새로운 지식이나 원리를 발견하고, 공학은 이를 현실 문제에 적용한다는 것이 교과서적 대답입니다. 하지만 실제로는 원리 발견을 위한 노력이 문제 해결에 가장 큰 Impact를 가져오기도 하고, 현실적인 문제 해결이 새로운 발견의 지름길이 되기도 하니, 이들간의 뚜렸한 경계를 짓기란 쉬운 일이 아닙니다. 

물론 이 모든 것을 다할 수 있으면 좋겠지만, 모든 직업을 다 가질수는 없으니 어느 시점에서는 선택을 해야 합니다. 하지만, 성공한 과학 / 공학자인 패널중 상당수가 처음에 학자로서 경력을 시작하여 어느 시점에 업계에 투신하는 경험을 이야기했습니다. 학문의 존재이유가 궁극적으로 현실 세계에 긍정적인 영향을 끼치기 위함이라면, 현실 세계의 문제를 직접 해결하는 일에는 분명 보람이 있을 것입니다. 

 WSDM Conference
최근 IT 전반의 주요한 트렌드인 '소셜' 열풍은 WSDM 본 학회에서도 예외가 아니었습니다. 많은 논문들이 소셜 데이터를 가지고 다양한 분석 및 테스크를 수행했습니다. 트위터 데이터에서 사람이나 장소등의 엔티티를 추출하는 논문만 수편에 달했습니다. 또한 다양한 소셜 서비스가 생기다보니 여러 소셜 서비스의 데이터를 묶어서 분석한 논문이 많았는데, Groupon딜이 소매업체에 미치는 영향을 Yelp리뷰와 Facebook Like를 가지고 추측해보는 식입니다. 

Identifying Content for Planned Events Across Social Media Sites

Hila Becker, Dan Iter, Mor Naaman and Luis Gravano

 

Daily Deals: Prediction, Social Diffusion, and Reputational Ramifications

John Byers, Michael Mitzenmacher and Georgios Zervas


또한 WSDM의 전통적 주제인 클릭 모델에 대한 논문도 많이 눈에 띄었습니다. 기존의 클릭 모델에 각기 다양한 요소를 추가한 것을 볼 수 있습니다. 

Incorporating Revisiting Behaviors into Click Models

Danqing Xu, Yiqun Liu, Min Zhang, Shaoping Ma and Liyun Ru

 

A Noise-aware Click Model for Web Search

Weizhu Chen, Dong Wang, Yuchen Zhang, Zheng Chen, Adish Singla and Qiang Yang

 

Personalized Click Model through Collaborative Filtering

Si Shen, Botao Hu, Weizhu Chen and Qiang Yang

 


저의 주된 참가목적은 MSR에서 수행한 인턴 프로젝트 논문을 발표하는 것이었습니다. 또한 연구실에서 공저한 학생이 개인 소셜 데이터의 검색 기법에 대한 논문을 발표하였습니다. 논문 및 발표자료는 아래서 보실 수 있습니다. 

Characterizing Web Content, User Interests, and Search Behavior by Reading Level and Topic [paper] [slide]
Jin Young Kim, Kevyn Collins-Thompson, Paul N. Bennett, Susan T. Dumais. To Appear in Proceedings of WSDM'12, Seattle, WA, USA, 2012.

Evaluating Search in Personal Social Media Collections [paper] [slide]
Chia-Jung Lee, W. Bruce Croft and Jin Young Kim. To Appear in Proceedings of WSDM'12, Seattle, WA, USA, 2012. 

PIM Workshop
학회를 마치고는 저의 관심분야인 개인정보관리(PIM)를 주제로 하는 워크샵에 참석했습니다. 워크샵은 보통 학회보다 논문 개제가 쉬운 까닭에 실적으로의 가치는 높게 평가받지 못하지만, 한정된 주제에 관심있는 사람들이 모이는 까닭에 좋은 피드백을 받을 수 있습니다. 저는 이번에 '연구자들이 개인정보관리 프로그램을 계속 개발하게 아니라, 있는 프로그램을 더 잘 활용할 수 있게 도와주어야 한다'는 주제로 발표를 했습니다. 

주간 반성 및 계획
마지막으로 조금 늦었지만 주간 리뷰를 올립니다. 이번주에는 놀랍게도 5점 (기억에 남을만큼 잘 보낸 시간)이 두번이나 됩니다. 학회 도착하여 발표때까지 적당한 긴장속에 매우 생산적인 시간을 보냈던 것입니다. 발표를 마친 다음날, 그리고 마지막 날 피로에 컨디션이 조금 떨어지기는 했지만, 전체적으로는 잘 보낸 한주였습니다. 




마치며
이제 10번째 참석하는 학회여서 이제 새로움보다는 익숙한 환경과 사람들을 만나는 편안함을 느꼈습니다. 하지만, 매 학회마다 발표되는 신선한 연구들과 다양한 사람들과의 교류는 학자로서의 길을 보람되게 합니다. 취업 직전이라 어찌보면 Networking(?)에 신경써야 되는 상황이었지만, 그런 생각 없이 즐겁게 시간을 보낸 것이 더 좋은 결과를 낳지 않았나 합니다.

연구실에서 대부분 참가비를 지원해주는 까닭에 그동안 기회가 없었는데, 이번 학회에서는 Student Volunteer를 했습니다. 등록비 등을 면제해주는것 이외에도, 같이 Volunteer를 하는 학생들과 친해지고, 또한 세션 Chair 및 스피커들과 좀더 가까히할 수 있는 좋은 기회가 되었던 것 같습니다. 이름 그대로 학생때만 할 수 있는 일이니 가급적 꼭 지원하시기를 바랍니다. 같은 의미에서 Doctoral Consortium같은 이벤트 역시 큰 도움이 됩니다. 

CIKM의 한국인 저자 논문들

검색연구동향 : 2009. 9. 12. 13:32   By LiFiDeA
이번 CIKM Conference의 한국인 저자 논문을 모아 보았습니다. SIGIR에서보다 더 많은 논문이 눈에 띄는군요.  저희 연구실의 서장원 선배, 그리고 SIGIR에서 뵈었던 나승훈님 이외에는 처음 뵙는 분들이라 기대가 큽니다. 영문 블로그의 CIKM의 제 논문 관련 포스팅, 그리고 저자 및 타이틀 통계도 참조하세요.

Full Paper
Generating Comparative Summaries of Contradictory Opinions in Text
Hyun Duk Kim (University of Illinois at Urbana-Champaign), ChengXiang Zhai (University of Illinois at Urbana-Champaign)

Towards Real-Time Measurement of Customer Satisfaction Using Automatically Generated Call Transcripts
Youngja Park (IBM T. J. Watson Research Center), Stephen C. Gates (IBM T. J. Watson Research Center)

Improving Web Page Classification by Label-propagation over Click Graphs
Soo-Min Kim (Yahoo! Labs), Patrick Pantel (Yahoo! Labs), Lei Duan (Yahoo! Labs), Scott Gaffney (Yahoo! Labs)

Short Paper
Online Community Search Using Thread Structure
Jangwon Seo (University of Massachusetts Amherst), W Bruce Croft (University of Massachusetts Amherst), David A Smith (University of Massachusetts Amherst)

An Improved Feedback Approach Using Relevant Local Posts for Blog Feed Retrieval
Yeha Lee (Pohang University of Science and Technology (POSTECH)), Seung-Hoon Na (National University of Singapore), Jong-Hyeok Lee (Pohang University of Science and Technology (POSTECH))

Extraction of a Latent Blog Community Based on Subject
Seok-Ho Yoon (Hanyang University), Jung-Hwan Shin (Hanyang University), Sunju Park (Yonsei University), Sang-Wook Kim (Hanyang University)