2009년 7월 8일 수요일

화이트노이즈 핑거프린팅을 이용한 저작권 워터마크 크롤링

일단, 나 자신은 지적재산권에 대해  70%정도 반대하는 입장임을 미리 밝혀두고.
둘째, 그렇지만, 인터넷 생태계를 무시한 채 홀로 카피레프트를 주창하는 거야 말로 손해보는 짓이라 생각함을 또한 밝혀두고.
셋째, CCL등은 한국에서는 회수를 건너온 탱자나 다름없다는 생각도 밝혀두고.
넷째, 이제부터 할 이야기들은 이미 쌔고 쌘 이야기인데다 특허권도 이중삼중으로 이미 남들이 걸어놓은 것임을 미리 밝혀두고.

우선 아래 이미지부터.
왼쪽 이미지와 오른쪽 이미지사이의 차이를 구별할 수 있을까?
아마도 육안으로 식별이 가능하다는 사람들은 상당한 민감성의 소유자겠다. (자세히 보면 알 수 있을 만큼 해놓았음.)

그럼 다음 이미지.
이제는 그 차이를 못보는 사람은 없겠지.

화이트노이즈란 원래 음향기기에서 소스의 음향과는 상관없이 기기자체의 기계적인 특성에 의해 발생하는 잡음신호를 일컫는 것으로써, 아무것도 틀지 않은 스피커에서 들리는 '치~'하는 미세한 잡음을 생각하면 되겠다.
그런데, 이러한 화이트노이즈는 정작 음악을 들을 때면 크게 신경쓰이지 않게 되는데, 최근 음향기기의 성능이 좋아져서 화이트노이즈 자체를 많이 잡기도 했거니와, 화이트노이즈의 특성상 랜덤하면서도 평탄하게 반복되기 때문에, 대조적으로 강한 가청성 특징을 가지고 있는 소스의 음향과 함께 들리면 상대적으로 묻혀서 잘 드러나지 않는다.

위의 이미지들이 이런 화이트노이즈의 특성을 이용한 워터마크핑거프린팅의 예시라고 할 수 있겠다. 물론, 이것은 어디까지나 모식도일 뿐이고, 실제로는 디지털신호처리 알고리즘을 이용해서 좀 더 교묘하고 티가 안나게 된다.

국내외에 출원되어 있는 특허라든가 기타 기술문서들을 살펴보면 상당히 높은 수준까지 되어있음을 알 수 있는데, 단순히 사람의 감각으로는 구별할 수 없을 뿐더러, 일부를 샘플링한다거나, 확대, 축소, 회전, 변형이 이루어져도 워터마크를 추출할 수 있다고 한다. 이미지뿐만 아니라 음성파일, 그리고 최근에는 동영상에도 이러한 워터마킹 기술이 많이 개발되어 있다.

보통 이러한 워터마크를 이용하여 저작권 정보라든가 기타 여러가지 응용이 가능한 메타정보를 숨겨놓기 마련.

뭐, 여기까지는 조금만 웹 검색을 해보면 다 알게 되는 내용이고.

비즈니스 모델로써 이걸 활용할 방법이 없을까?

아무래도 영향력이 큰 네이버나 구글 등에서 이러한 워터마킹을 소비자에게 서비스로 제공한다고 하자. 즉, 네이버 블로그에 그림이나 음악, 동영상등을 올릴 때 저작권관련 워터마킹이 자동으로 삽입된다는 가정.

1) de facto 표준
워터마킹의 가장 큰 문제점은 사용하는 솔루션마다 삽입/검출 방식이 다 다르다보니 범용적으로 활용될만한 표준방식이 없다는 점.
시장의 지배적 사업자가 선도하거나 최소한 영향력있는 사업자들의 컨소시엄의 형태로 이러한 범용 알고리즘을 채택하면 파급력과 활용도가 더 커지리라.

2) 저작권의 확인
사실상 사용자의 저작권에 대한 무지가 가장 큰 원인이나 다름없는 상황. 이것을 캠페인이나 계몽만으로 정화하기는 사실상 어렵다. 그렇다면, 솔루션 차원에서 접근해보면 어떨까?
사용자가 자신의 블로그에 그림 파일을 업로드할 때, 업로드된 이미지에서 워터마크를 추출하여(만약 있다면), 해당 라이센스에 대한 경고를 사용자에게 해줄 수 있다면. 즉, 웹에서 돌아다니는 이미지를 내 계정에 올리려고 하니 "해당 이미지는 홍길동님에게 저작권이 있으며 홍길동님은 이 이미지를 비영리적 목적과, 원본을 변형하는 않는다는 조건하에서만 웹 게시를 허가하였습니다."같은 경고 메시지를 띄워준다는 시나리오.
이른바 고지 및 경고의 기능을 수행하는 동시에, 원저작자의 의도와 정보를 충실히 전달하며, 오용의 가능성을 줄여줄 수 있겠다.

3) 저작권의 삽입
뿐만 아니라, 자신의 창작물의 경우에는 자신의 저작권 정책에 따라 자신의 워터마크를 삽입해줄 수 있다.
대개 개인의 경우 자신의 저작권에 대한 이해가 부족할 뿐더러, 저작권을 보호할 수 있는 장치를 개인적인 수준에서는 마련하기 어렵기 때문에, 이러한 장치들을 개인에게 사용할 수 있도록 제공해주는 것은 상당한 가치가 있다.
지금은 고작해야 우클릭금지라든가, CCL 마크를 아래에 써놓는다든가 정도. 효용도 그다지 높지 않을 뿐더러 귀찮기까지 하다. 그러니, 창작자가 별다른 수고없이도 이용할 수 있는 저작권 보호 솔루션의 필요성은 높다 하겠다.

4) 저작권의 추적
네이버같은 검색엔진을 보유하고 있는 사업자가 빛을 발하는 경우인데, 검색크롤러가 파일들을 크롤링을 하면서 워터마크를 검출하여 원저작권자에게 해당 컨텐트가 어디에서 어떻게 사용되고 있는지를 알려주는 서비스 같은 것이 가능하겠다. 뭐, 잘못사용하고 있는 경우라면 고소대행서비스까지 곁들이거나. ^_^
사람들은 평판과 명예에 민감하기 때문에, 자신의 저작물이 어떻게 쓰이고 있는지를 알고 싶어하는 욕구는 상상이상으로 강력하다. 해당 저작물을 퍼블릭 도메인으로 풀어놓은 경우라 하더라도.
네트워크의 특성상 컨텐트의 전파는 링크를 따라 흐르기 마련이고, 크롤러의 동선도 링크를 따라가기 때문에 저작물의 추적은 그다지 맨땅에 헤딩하는 정도의 어려움은 아니다.

5) 퍼블릭 도메인 아카이브
이런 식으로 각 저작물에 대해 명시적으로 저작권을 부여할 수 있다면, 그 중에는 저작권 행사를 포기하는 퍼블릭 도메인 컨텐트들도 생길 것이다. 이러한 퍼블릭 도메인 컨텐트들을 자동으로 모아 많은 사람들이 저작권 걱정없이 이용할 수 있는 퍼블릭 도메인 아카이브 서비스도 가능하겠다.


뭐, 이래저래 역시 네이버나 구글 정도가 아니면 좀 엄두가 안나는 규모이긴 하지만...


ps. 텍스트는 그 특성상 워터마킹이 불가능한 게 옥의 티.

댓글 1개:

  1. 고소대행 서비스. 그거 혹 하겠는데요? 좋은 내용 잘 봤습니다.

    답글삭제