지난주에는 시애틀에서 열린 WSDM학회에 다녀왔습니다. WSDM은 올해로 5회째를 맞는 젊은 학회이지만, 비교적 적은 양의 논문을 Single Track 형식으로 발표하여, 참가자들간의 활발한 소통이 이루어지는 것이 특징인 학회입니다. 저에게는 작년 여름의 인턴 프로젝트 및 연구실에서 공저한 논문을 발표하고, 진로 모색을 위해 사람들을 만나는 자리였습니다. 학회 일정을 돌아보며 배운 점을 기록하고, 마지막에 주간 리뷰를 적어볼까 합니다 ;)

Doctoral Symposium 
Doctoral Symposium은 학위과정에 있는 대학원생들이 논문 주제에 대해 발표하고 학계 Senior들의 의견을 들을 수 있는 자리입니다. 논문을 마쳐가는 저같은 사람보다는 한창 진행중인 학생들을 위한 자리이지만, 오후에 열리는 Career Workshop에서 연구 및 진로에 대해 학계 및 산업계 종사자인 패널의 다양한 의견을 들을 수 있었습니다. 

우선 흥미있었던 주제는 Engineering, Applied Science, Basic Science의 경계에 관한 것이었습니다. 과학은 새로운 지식이나 원리를 발견하고, 공학은 이를 현실 문제에 적용한다는 것이 교과서적 대답입니다. 하지만 실제로는 원리 발견을 위한 노력이 문제 해결에 가장 큰 Impact를 가져오기도 하고, 현실적인 문제 해결이 새로운 발견의 지름길이 되기도 하니, 이들간의 뚜렸한 경계를 짓기란 쉬운 일이 아닙니다. 

물론 이 모든 것을 다할 수 있으면 좋겠지만, 모든 직업을 다 가질수는 없으니 어느 시점에서는 선택을 해야 합니다. 하지만, 성공한 과학 / 공학자인 패널중 상당수가 처음에 학자로서 경력을 시작하여 어느 시점에 업계에 투신하는 경험을 이야기했습니다. 학문의 존재이유가 궁극적으로 현실 세계에 긍정적인 영향을 끼치기 위함이라면, 현실 세계의 문제를 직접 해결하는 일에는 분명 보람이 있을 것입니다. 

 WSDM Conference
최근 IT 전반의 주요한 트렌드인 '소셜' 열풍은 WSDM 본 학회에서도 예외가 아니었습니다. 많은 논문들이 소셜 데이터를 가지고 다양한 분석 및 테스크를 수행했습니다. 트위터 데이터에서 사람이나 장소등의 엔티티를 추출하는 논문만 수편에 달했습니다. 또한 다양한 소셜 서비스가 생기다보니 여러 소셜 서비스의 데이터를 묶어서 분석한 논문이 많았는데, Groupon딜이 소매업체에 미치는 영향을 Yelp리뷰와 Facebook Like를 가지고 추측해보는 식입니다. 

Identifying Content for Planned Events Across Social Media Sites

Hila Becker, Dan Iter, Mor Naaman and Luis Gravano

 

Daily Deals: Prediction, Social Diffusion, and Reputational Ramifications

John Byers, Michael Mitzenmacher and Georgios Zervas


또한 WSDM의 전통적 주제인 클릭 모델에 대한 논문도 많이 눈에 띄었습니다. 기존의 클릭 모델에 각기 다양한 요소를 추가한 것을 볼 수 있습니다. 

Incorporating Revisiting Behaviors into Click Models

Danqing Xu, Yiqun Liu, Min Zhang, Shaoping Ma and Liyun Ru

 

A Noise-aware Click Model for Web Search

Weizhu Chen, Dong Wang, Yuchen Zhang, Zheng Chen, Adish Singla and Qiang Yang

 

Personalized Click Model through Collaborative Filtering

Si Shen, Botao Hu, Weizhu Chen and Qiang Yang

 


저의 주된 참가목적은 MSR에서 수행한 인턴 프로젝트 논문을 발표하는 것이었습니다. 또한 연구실에서 공저한 학생이 개인 소셜 데이터의 검색 기법에 대한 논문을 발표하였습니다. 논문 및 발표자료는 아래서 보실 수 있습니다. 

Characterizing Web Content, User Interests, and Search Behavior by Reading Level and Topic [paper] [slide]
Jin Young Kim, Kevyn Collins-Thompson, Paul N. Bennett, Susan T. Dumais. To Appear in Proceedings of WSDM'12, Seattle, WA, USA, 2012.

Evaluating Search in Personal Social Media Collections [paper] [slide]
Chia-Jung Lee, W. Bruce Croft and Jin Young Kim. To Appear in Proceedings of WSDM'12, Seattle, WA, USA, 2012. 

PIM Workshop
학회를 마치고는 저의 관심분야인 개인정보관리(PIM)를 주제로 하는 워크샵에 참석했습니다. 워크샵은 보통 학회보다 논문 개제가 쉬운 까닭에 실적으로의 가치는 높게 평가받지 못하지만, 한정된 주제에 관심있는 사람들이 모이는 까닭에 좋은 피드백을 받을 수 있습니다. 저는 이번에 '연구자들이 개인정보관리 프로그램을 계속 개발하게 아니라, 있는 프로그램을 더 잘 활용할 수 있게 도와주어야 한다'는 주제로 발표를 했습니다. 

주간 반성 및 계획
마지막으로 조금 늦었지만 주간 리뷰를 올립니다. 이번주에는 놀랍게도 5점 (기억에 남을만큼 잘 보낸 시간)이 두번이나 됩니다. 학회 도착하여 발표때까지 적당한 긴장속에 매우 생산적인 시간을 보냈던 것입니다. 발표를 마친 다음날, 그리고 마지막 날 피로에 컨디션이 조금 떨어지기는 했지만, 전체적으로는 잘 보낸 한주였습니다. 




마치며
이제 10번째 참석하는 학회여서 이제 새로움보다는 익숙한 환경과 사람들을 만나는 편안함을 느꼈습니다. 하지만, 매 학회마다 발표되는 신선한 연구들과 다양한 사람들과의 교류는 학자로서의 길을 보람되게 합니다. 취업 직전이라 어찌보면 Networking(?)에 신경써야 되는 상황이었지만, 그런 생각 없이 즐겁게 시간을 보낸 것이 더 좋은 결과를 낳지 않았나 합니다.

연구실에서 대부분 참가비를 지원해주는 까닭에 그동안 기회가 없었는데, 이번 학회에서는 Student Volunteer를 했습니다. 등록비 등을 면제해주는것 이외에도, 같이 Volunteer를 하는 학생들과 친해지고, 또한 세션 Chair 및 스피커들과 좀더 가까히할 수 있는 좋은 기회가 되었던 것 같습니다. 이름 그대로 학생때만 할 수 있는 일이니 가급적 꼭 지원하시기를 바랍니다. 같은 의미에서 Doctoral Consortium같은 이벤트 역시 큰 도움이 됩니다. 
올 한해 두번째 리뷰입니다. SIGIR데드라인이 다가오면서 한결 바빠졌습니다. 또한, 보스턴의 집에서 보냈던 지난주와는 달리 이번주는 월~수요일을 학교가 있는 Amherst에서 보냈습니다.

반성 및 계획
지난주 적은 데이터에도 불구하고 재미있는 관찰을 많이 할 수 있었는데, 과연 2주간의 데이터는 어떤 이야기를 해줄까요? 주간 리뷰에 대한 배경설명은 지난 리뷰를 참고하시면 됩니다. 우선, 지난주의 결론을 살펴봅시다. 

1. 적절한 긴장이 만족스런 생활에 매우 중요합니다. 위 데이터는 긴장의 정도가 높은 주중 / 오전&오후에 가장 높은 점수를 기록함을 알려줍니다.
2. 주말 / 밤의 낮은 평점을 할 일이 정해진 주중에 비해 자유도가 높은 여가 시간을 제대로 보내지 못한다고 해석할 수도 있습니다.  
3. 일찍 자고 일어나는 것은 생활의 전반적인 만족도에 중요한 영향을 끼칩니다. 

과연 지난주의 학습 결과가 이번주에 어떤 변화를 가져왔을까요?  데이터 포멧은 지난주와 같지만, 수면시간 (sleep)과 주간 결산을 추가했습니다. 추세를 시각화하기 위해 색상을 사용했는데, 데이터 시간 데이터는 작아질수록, 평가치 데이터는 커질수록 녹색을 사용했음을 밝힙니다. 


우선 이번주의 결과는 평균적으로 지난주와 유사합니다. 수면시간은 약간 늦어졌지만 기상시간은 변화가 없습니다. 저녁 시간의 만족도는 조금 올라갔지만 (2.6->2.9), 오후 시간에서 부진한 탓에 평균은 별 차이가 없습니다. 날짜별로는 화요일을 정점으로 주중 후반으로 갈수록 점수가 떨어졌습니다. 또한, 월~수를 학교가 있는 Amherst에서 보낸 탓인지 주중 수면시간 및 평가치의 편차가 매우 큽니다. 
지난 주말 통계를 내본 것 이외에는 별 특별한 노력을 하지 않았기 때문에, 이번주까지의 결과는 일종의 Baseline으로 생각해도 될 것 같습니다. 이번주의 일지와 통계를 대조해가며, 데이터의 의미를 요약해 보았습니다. 

- 주초의 긴장감이 주말로 갈수록 풀린다.
- 하루를 (1월 10일) 잘 보낸 뒤에 느슨해지는 경향이 있다. 
- 일단 느슨해진 후에는 되돌리기가 힘들다.

수요일 이후의 저조한 점수를 '느슨함'으로 해석한 이유는, 컨디션 악화로 일을 못할만큼 무리하지는 않았기 때문입니다. 이보다는 하루를 잘 보낸 후에 긴장이 풀려 제대로 시간을 보내지 못했던 것 같습니다. 사람이 기계는 아니니, 이런 문제를 해결한다고 매일, 매순간 스스로에게 긴장감을 강요하는 것이 답은 아닐 것입니다. (그렇게 살고 싶은 사람이 있을까요?)

이보다는 주중 하루 저녁을 쉬면서 컨디션 조절에 사용하는 것이 더 나은 방법인듯 합니다. 또한, 24시 수면 / 6시 기상이 힘들어보이니, 아예 24시 / 7시를 원칙으로 바꾸려고 합니다. 

읽고 배운 것
검색/HCI

https://plus.google.com/109099432758822886377 구글에서 웹검색시에 소셜 및 개인정보를 같이 보여주는 서비스를 개시했습니다. 이는 과거 구글 데스크톱에서도 제공하던 기능이지만, 이제 소셜(G+) 네트워크까지 모든 종류의 서비스를 제공하는 구글에 대부분의 정보관리를 의존하는 사람에게는 참으로 편리한 기능입니다. 다음 단계는 이런 정보를 좀더 편리한 인터페이스에서 제공하는 (e.g., Siri) 것이겠죠. 

http://goo.gl/O5oYE SWIRL은 정보검색 (IR) 분야 대가들이 모여 미래 비전을 논하는 자리입니다. 초청 인사들이 추천하는 논문 목록이 컨퍼런스 홈페이지에 올라와 있군요. 이채로운 점은 순수 문서 랭킹 모델에 대한 논문은 하나도 없다는 점입니다. 대부분의 추천작들은 사용자, 인터렉션, 컨텍스트 등을 논하고 있습니다.

자기개발
http://goo.gl/u2kms 맨땅에서 창업한 사장님이 들려주는 '잘 혼나는 법' 10가지. 이렇게 혼날수 있다면 그것이 바로 최고의 교육일겁니다. 이를 요약하면 : 야단과 일의 분리 / 일과 사람의 분리 / 인터랙션 / 일사부재리 / 뒤끝없음 / 자진납세 / 확전금지

http://blog.naver.com/profjun/150128877502 "학문 이외에 다른 하고 싶은 일이 많다면, 그 사람은 '학자의 그릇'이 아니다. 공부 이외의 다른 밥줄은 전혀 생각할 수 없는 절박함이 바로 학자의 길을 가는 젊은이가 갖춰야할 조건이다." 

마치며
지난주와 비슷하게 보낸 한주였지만,  스스로의 삶에 대한 더 정확한 지식을 갖게 되었다는 점에서 의의를 찾으려고 합니다. 몇가지 결심을 한주동안 지키며 변화를 모색해보려 합니다.