2009년 3월 19일 목요일

피라미드 RSS

사람에게는 얼마만큼의 땅이구독블로그가 필요할까?

블로그를 읽는 이유가 인식의 확장이라면, 메타블로그등을 찾는 이유는 인식의 확장의 기회를 얻기 위해서일테다. 그러나 이러저러한 이유로 메타블로그들은 노이즈 대 신호비가 그닥 좋은 편은 아니다. 게다가 집단지성이랄까, 인기투표랄까, 이러저러한 메타블로그들의 시스템으로 추천되는 블로그들에 대한 내 만족도도 그닥 높은 편은 아니다. 무엇보다도 그런 것들을 일일이 내 경험으로 추적 확인해봐야 하는 것 자체도 귀찮다.  

현재 내 RSS리더기에는 200여개의 블로그가 등록되어있다. (블로그 읽는데 바빠 블로그 쓸 시간이 없다는 좋은 핑계.) 여하튼 이러다보니 RSS리더기에 등록된 블로그들을 관리하는 것만 해도 큰 일. RSS 리더기를 관리하다보면 늘 뭔가 2% 아쉽다.

그리하여 생각해본 다단계 혹은 피라미드 RSS.

예를 들어 내가 Stella et Fossilis(http://conodont.egloos.com/)를 즐겨 읽는다고 하자. 내가 그를 즐겨 읽는다는 것은, 내가 별이라든가, 공룡이라든가, 화석이라든가, 창조론자들과의 플레임워라든가 이런 이야기를 즐기기 때문일거다. 또 내가 초록불의 잡학다식(http://orumi.egloos.com/)를 즐겨 읽는다고 하자. 역시 유사역사학에 대한 입장이 나와 비슷하다거나, 작가로서의 그가 취향에 맞는다든가 하는 이유이겠지. 아무리 유머넘치고 재미있고 인기있는 블로그라 한들, 내가 관심갖지 않는 분야라면 바이바이.

가설 1) 어떤 개인이 구독하는 블로그는 그 개인의 관심과 취향의 연장범위내에 위치한다.

두 블로그를 즐겨보는 나는, 지구과학이나 역사학에 관심을 가지고 있을 가능성이 있는데다, 사이비에 대한 알레르기가 있다고 단언해도 될 듯. 물론 그보다는 좀더 복잡다단한 무언가겠지만 일단 그렇다는 이야기이다.
그렇다면 나라는 인간은 내가 읽는 블로그의 합집합으로 외연을 두르고,  교집합으로 내포된 특징을 가지고 있다 해도 크게 틀리지는 않을듯.

가설 2) 어떤 개인이 구독하는 블로그 특성의 교집합은 그 개인의 고유성을 나타낸다.
가설 3) 어떤 개인이 구독하는 블로그 특성의 합집합은 그 개인의 관심범위를 나타낸다.

이런 경우, 그 개인이 과연 몇개의 블로그를 읽느냐에 따라 이 가설의 신뢰도가 달라질 수 있다. 너무 적은 수를 읽는다면 정확한 측정을 하기 위한 모수가 부족하여 빠지는 부분이 있을 수 있고, 너무 많은 수를 읽는다면 느슨하게 노이즈가 끼어들 수 있기 때문이다.

만약 어떤 끝내주는 RSS 리더기가 있는데 유일한 단점으로는 구독등록이 10개까지만 가능하다고 하면 이 리더기를 사용하는 개인은 많은 고민을 해야 할 것이다. 10개 중에 어떤 블로그를 포함시킬 것인가. 즉 개별 블로그들이 나에게 주는 가치에 대해 평가해야 할 것이고, 또 매우 신중하게 그 점수를 매길 것이다. 내가 비록 어떤 블로그를 사적으로 알거나, 평소에 매우 즐겨 봤었다 치더라도 10개 안에 넣어줄 것인가에 대해서는 또 다른 차원의 문제가 될테니까.

가설 4) 개인을 규정지을 수 있는 최소 구독 블로그 수 N이 존재한다.


내 생각으로는 개인차가 있겠으나 대략 10 ~ 20 개 정도가 아닐까 한다. 물론 어떤이는 스포츠신문 읽는 느낌으로 몇백개의 블로그를 읽어 제끼는 사람도 있을테고, 또 어떤이는 이 세상에는 딱 5개의 블로그만 가치있어... 하는 사람도 있겠지만.


이상의 가설 1~4를 기반으로 피라미드(다단계) RSS 어그리게이션 시스템을 제안해본다면...  

1) 나는 최대 10개까지의 블로거만 선정할 수 있다.
2) 각 블로거 역시 각각 최대 10개까지의 블로거만 선정할 수 있다.
3) 나는 내가 선정한 1차 블로거 10개와 그들이 각각 1차 블로그로 선정한 2차 블로거 최대 100개의 글을 읽을 수 있다. (중복 포함)
4) 모든 블로거가 신중하게 선택했다면, 이론상 110개의 블로그에서 올라오는 글들은 나의 관심과 일치할 가능성이 매우 높다고 할 수 있다.
5) 110개의 블로그 중에는 교차중복되는 케이스가 있을 수 있으며, 중복카운트가 높을 수록 나의 관심과 일치할 가능성이 특히 더 높을 것이다.
6) 1차 블로거 10개를 재조정하면 2차 블로그 100개는 그에 맞춰 자동 재조정된다.


10개의 1차 블로그를 선택하는 것만으로 100개의 '내가 관심가질만한' 블로그 리스트를 얻을 수 있다. 일일이 100개의 블로그를 찾아 해메지 말고, 내가 신뢰할만한 블로그들에게 선택을 맡기는 것. 나의 투입노동력은 줄이고, 효과는 극대화하기.

10개의 1차 블로그를 어떻게 선택할 것인가가 이 시스템의 첫번째 재미.
만약 내가 1차 블로그를 모두 프로그래밍 관련 블로그로 채운다면 100개의 2차블로그 대부분도 프로그래밍이나 그 비슷한 것들을 다루는 블로그일 가능성이 높다. 이 상황에서 내가 1개의 프로그래밍관련 1차 블로그를 빼고 대신 영화관련 블로그를 하나 1차 블로그로 등록하면, 100개의 2차 블로그 중에도 영화관련 블로그들이 등장하기 시작할 것이다. 1차 블로그를 넣고 빼고 함으로써 스펙트럼이 어떻게 변하는지를 지켜보는 건 흥미로운 경험이 될 것이다.

두번째 재미는 기대하지 않았던 발견.
한정된 블로고스피어라지만, 사람은 자기가 노는데서만 놀게 되기 마련이다. 이글루스 블로거라면 아무래도 이글루스 블로거만 알게 되기 쉽다. 네이버에도 좋은 블로그가 있겠지만 일일이 찾아다니기란 어려운 일.
허나 누군가는 그런 바운더리에서 넘어선 사람이 있을 테고, 운좋게 그런 이를 1차 블로거로 선택하면 2차 블로그로 나의 활동반경을 넘어선 곳의 블로그들이 보일 수도 있다.

세번째 재미는 용납될만한 정도에서의 일탈.
일상적이라면, 평범한 프로그래머인 나는 서양미술사 전문 블로그를 알게 될 가능성이 매우 낮다. 그리고 그게 내 관심사와 관련있을 거라는 생각은 죽었다 깨어나도 못했을 일.
그러나 내 1차 프로그래밍 관련 블로그들 중의 어떤 이들이 어떤 서양미술사 전문 블로그를 그들의 1차 블로그로 선택했다면, 그들을 신뢰하는 나로서는 그들의 선택 역시 신뢰할만한 이유가 있다고 판단할 수 있을 것이다. 어쩌면 내 선입견과는 달리 서양미술사가 프로그래밍과 관련된 접점이 있을 수 있을 것이다. 혹은 그 학문적 방법론이 프로그래머의 그것과 일치할 수도 있을테고, 혹은 그저 프로그래머의 단무지적 공돌마인드를 순화시켜주기에 서양미술사가 가장 유익해서일 수도 있을 것이다.
어쨌거나 최소한, 내가 신뢰하는 그들이 선택한 것이라면 나 역시 신뢰할 수 있을 가능성은, 아무거나 찍어서 판단하기 혹은 메타블로그의 인기블로그의 그것보다는 훨씬 높을 것이라는 점은 확실하겠다.


---
예전에 만들고 싶어했고, 만들려고 했었으나 실패했던 시스템. 누가 안만들어주나?

댓글 10개:

  1. 말씀하신 과정을 거쳐서 계산되지는 않지만, Collaborative Filtering 기법은 유사한 효과를 냅니다.



    1. 내가 구독하는 블로그를 공통적으로 많이 구독하는 사용자를 찾아내고, 그런 사용자들이 공통으로 구독하지만 내가 아직 구독안하는 블로그를 추천할 수 있으며

    2. A블로그를 구독하는 사람중 많은 비율이 B블로그도 구독하고 있다는 것을 이용하여 A블로그를 구독하는 사람에게 B를 추천하는 방법



    대략 이런 식인데요, 이글루스 내의 마이밸리의 추천블로그가 그런식으로 계산됩니다.(제가 개발했습죠-_-)

    잘 안맞는다는 말도 있지만.. 기대치를 좀 낮추면 ^^;



    구글 리더에서도 비슷한 방식의 RSS구독 개인화추천기능이 있더라구요 ^^



    저 기억하시나 모르겠네요. 계속 구독하고 있다가 답글달 만한 글이 있어서 남기고 갑니다.

    답글삭제
  2. @푸른달팽이 - 2009/03/19 18:49
    :)



    유일한 차이는 아마, 내가 신뢰하는 블로거에게 위임하느냐, 아니면 프로파일링된 나를 포함하는 대중의 선택을 신뢰하느냐의 차이겠지요. 일정정도 유효하기는 하겠지만, 근본적으로 저는 대중의 선택을 믿지는 않습니다.

    답글삭제
  3. @푸른달팽이 - 2009/03/19 18:49
    굿~ 두분 다 멋진 발상입니다..



    이글루스는 나를 구독하는 사람을 기반으로 한 필터링이고, 이바닥님은 내가 구독하는 사람을 기반으로 한 필터링이냐의 차이겠내요. 특히 20개까지만 구독가능한 RSS리더가 왠지 좋아보이내요. 그런데 또 생각해보면 내가 직접 구독하는 100개의 블로그 보다, 피라미드 방식으로 자동 구독되는 방식의 100개 블로그가 내가 원하는 컨텐츠 보다 만족도가 높을 수 있을까는 모르겠습니다. 저는 근본적으로 알고리즘의 선택에 아직은 큰 기대를 안하고 있거든요. :)



    RSS에 대한 글 몇가지 트랙백 해봅니다.

    답글삭제
  4. trackback from: RSS와 망각 2
    RSS 구독자 수를 봤다. 늘기는 커녕 2명이 빠져 있더라. RSS 구독자수가 많아질 지언정 줄어드는 것은 흔치 않은 일이다. 리스트에서 부러 제외하는 수고를 감수해야 하기 때문이다. 사들이는 것은 쉽지만, 버리는 것은 어려운 것과 같은 이치다. 무엇보다, 그것은 이 블로그가 더 이상 흥미를 유발하지 못한다는 명백한 의사표현이 된다. 그래서 마음에 들지 않는 블로거가 있을 때 일부로 RSS를 등록한 다음 절묘한 타이밍에 삭제해버리는 모종의 복수를...

    답글삭제
  5. trackback from: allblog in hanrss
    꽤 오랫동안 블로그 밖으로 출입을 하지 않고 있다.이렇게 된 것엔 복합적인 이유가 있지만,직접적인 계기는 80명에 달하는 파트너의 블로그를 야심차게 RSS에 일괄 등록하면서다.그 후로 RSS리더에는 일절 발길을 두지 않고있다.자연히 교류하던 블로거들과 왕래도 동결된 상태고.생각해봤는데,문제는 정보수용의 임계점 때문인 듯하다.한 인간이 수용할 수 있는 정보의 양은 한계가 있어서한계를 넘어서면 차라리 도피하고 싶은 심리가 생기는 것 같다.청소의 요체가...

    답글삭제
  6. @푸른달팽이 - 2009/03/19 18:49
    egoing// RSS리더기라기보다는 메타블로그의 대체재가 되겠죠. 당연히 나의 일반구독리스트는 따로 관리되어야 할테구요.. 아마도, 나의 일반 구독 리스트 중 상위 10개를 가지고 구현되는 시스템 쯤 되지 않을까요?

    답글삭제
  7. @푸른달팽이 - 2009/03/19 18:49
    #1

    일전에 한RSS가 페이퍼를 폐지하려고 했었는데 어떤 로직으로 전환하려는 것이었는지 궁금하내요. 이바닥님 방식도 좋을 것 같습니다.



    #2

    저는 한RSS가 회원가입 때 왜 블로그 주소를 안 받는지 참 궁금합니다. 이 정보가 있다면 블로고스피어의 거대한 관계지도가 만들어질텐데 말이죠.



    #3

    종종 올블로그와 한RSS의 빅딜을 생각해봅니다.

    답글삭제
  8. 굉장히 흥미로운 제안이신 것 같습니다.

    그런데 이 시스템을 '(상업적인 목적을 장차로는 추구하는) 서비스'로 기획하고 계신 것인지요? 아니면 맹아적인 형태로 이런 서비스가 생기면 어떨까?라는 정도로 구상하시는 것인지요? 궁금합니다..



    위 이고잉님 댓글에 대한 답글로 "메타블로그에 대한 대체제"라는 말씀을 하셔서 더 궁금하네요.

    답글삭제
  9. @민노씨 - 2009/03/24 05:10
    예전에, 상업용(!)으로 만들다가 다 못만들었던 프로젝트였습니다. ^^; 묵혀둬봤자 아깝기도 해서 누군가에게라도 인사이트를 줄 수 있다면 좋겠다는 생각에 풀어놓는 떡밥입니다.

    답글삭제
  10. trackback from: 추비추(가제) [No.1] 3월 넷 째 주 (2009. 3. 23~29)
    추비추(가제) : 2009. 3. 23~29일 (3월 넷 째주)

    블로그래픽 동인들이 자율적으로 선정한 링크에 대한 솔직담백한 단평들.

    고정 연재. 오늘은 첫 번 째 글.

    1. 피라미드 RSS (ebadac) 2009/03/19 16:33

    http://e...

    답글삭제