jamiepark

Linked Data로 앞당기는 차세대 웹! with Tim Berners-Lee

In Future of web, Social Media on 2009/05/18 at 3:43 오후

이번 글은 웹의 미래를 “open”과 “linked Data”라는 기본방향과 관련해서  제시하고 있는 글입니다

개념은 Tim Berners-Lee의 TED 강연을 기초로 했고, 역시 동영상을 보시면 훨씬 더 좋구요. 언제나처럼 뒤에 약간의 설명을 덧붙였어요. 약간 길지만 꼭 끝까지 읽어주세요. 함 믿어보시라니깐!!!! ^^

 

그럼 시작하겠습니다.

 

Tim Berners-Lee 가 2009년 2월 TED 강연에서 큰 목소리로 사람들에게 외쳤습니다.

6

RAW DATA NOW!

이제부터는 꼭! 가공안한 Data를 줘!!!!!!!!!!!

 

 

 

도대체 왜 Raw Data가 필요한데?

Tim Berner-Less는 linked Data가 WWW자체를 바꾸는 것이라고 말합니다. 우리는 가공된 문서의 웹(페이지의 웹)에서 Data의 웹으로 진입하는 중도에있고,  모든 사람들이 Data들을 연결해서 자유롭게 활용하기 위해서는 정부, 기업, 너나 할 것 없이 Data를 가공하지 않은채 공개해 웹에다가 넣어 둬야한다고 주장합니다. 

 

아래 이미지를 보시면 아시겠지만, 과거에 우리는 각자의 Data로 단지 한 두가지의 꽃만 피울 수 있었습니다. 그렇지만 Data들을 잘게 나눠서 어떤 연결된 Data 표준을 만든다면 거기에서는 엄청난 조합이 이뤄져 수백수천가지의 꽃들이  꽃들이 피어날 수 있겠죠.

 

1

좀 쉽게 예를 들어볼까요? Wikipedia 아시죠? 여기에는 많은 웹페이지 혹은 문서(Documentations: 읽기위한 페이지)들이 있습니다. 이 부분은 거의 전부가 가공된 정보입니다. 

3그럼, Wikipedia이  페이지 오른쪽 빨간 네모박스쪽을 한번 보실래요? 이 부분은 Data -가공하지 않은 자료들을 그냥 웹에서 불러오는 겁니다. 이렇게 빨간 네모 박스 부분으로 Data의 토양(DBpedia)을 한번 만들어봅시다.

 

2

 Dbpedia는 여기 중심에 있는 파란동그라미예요. 여기에서 나는 Berlin에 대한 정를 찾으려고 합니다. 여기에 다른 빨강, 초록, 주황 동그라미들은 DBpedia와 연결되어 있는 데이터들(linked data)입니다. 그 연결된 데이터들에게 또 다른 연결된 데이터들이 있습니다. 자 그럼 파란 동그라미를 한번 휙 당겨보세요. 그럼 연결된 다른 동그라미들이 후두둑 같이 덩달아 따라오겠죠? 즉 DBpedia에서 Berlin을 찾으면 여기에 연결된 모든 동그라미에서 Berlin의 정보들이 줄줄이소세지처럼 따라나오게 되는 겁니다.

 

그럼 Data에 대해서 좀더 생각해봅시다. Data는 사실 엄청나게 다른 폼으로 저장되어 있어요. Web의 다양성에 대해서 생각해보세요. 웹에는 개인정보, 날씨, 국가정보, 이야기에 대한 정보, 사진 등 엄청나게 많은 정보들이 자기 폼대로 올라가 있습니다. 정부가 자료를 발표할  땐, 전 이게 가공되지 않고 연결된 데이터였음 좋겠습니다. 이걸로 나는 이 나라에서 어떻게 살아가야 하는지를 알수도 있고, 아이들 숙제도 도와줄수 있을겁니다. 실제로 유익한 것들이라니까요. 제가 지금 이야기 하는 것은 이러한 데이터들을 더 다양하게 사용가능하게 해서 더 나은 방식으로 함께 살아가고자 하는 이야기입니다.

 

뭔가 너무 거창하게 들린다면 이건 어떨까요? Data는 우리의 삶입니다. Facebook에 로긴한다고 생각해보세요. 여기 내 친구 Jamie-이게 Data입니다. 여기 Jamie의 사진이 있네? – 이것도 Data구요. Data, Data, Data! Facebook에서 뭘 할 때마다, Facebook은 Data를 쌓고 이를 이용합니다. 그 연결된 Data들로 사람들을 더 재미있게 만들어주죠. 

11

그런데, 다른 사이트, 예를 들어 “미투데이”에 들어가면 내가 이 Facebook에 있는 Jamie의 사진을 다른 사람한테 보여주려고 해도 그 장벽을 넘을 수가 없어요. 수없이 많은 사람들이 여기에 대해서 벽을 낮추자고 얘기했지만 지금껏 계속 절망뿐이었습니다. 이런 Data들은 모두가 알아들을 수 있는 -상호 이용가능한- 형태가 되어야 풀어낼 수 있고, Linked data(변형되지 않은 연결된 정보들)가 처음엔 더디더라도 결국엔 이런 문제들을 해결해 줄 겁니다.

 

어떤 정보가 있을 때, 요걸 그냥 혼자 간직했다가 예쁘게~~ 웹사이트로 만들어서 보여주려는 사람들이 있습니다. 이를 정보끌어안기(Database hugging)이라고 칭합니다. 뭔가 예쁘게 웹사이트로 만들기 전에는 안보여주는 거지요. 네, 누가 예쁘게 만들지 말라고 했나요? 만드세요!!! 그런데 우리에게는 걍 순수한(가공안한) Data를 달라고요!!!!!!!! 우리는 Data를 원해!!!!!!!! 가공안한거!!!!! 자, 연습합시다. 따라하세요. 가공안한 Data!!! 내가 뭘원한다고요? 가공안한 Data!!!!!!!!!!!!!!!!!!!!(이 부분은 실제 강연에서 Tim Berners-Lee가 관객들에게 따라하라고 시킨 부분입니다 ㅎㅎㅎ)

 

 

[Jamie가 덧붙이는 이야기들]

1. 좀 더 쉬운 설명

예를 들면요. 지금까지의 웹은 이런 거였습니다.  G마켓에서 파는 별모양 비키니 페이지를 예로 들어봅시다.

현재 사이트에 보면 거기의 정보들이 G마켓의 구조에 맞는 DB에 가공, 저장되어 있어서 그정보는 보여주지도 않았지만, 볼 수 있다해도 다른 사람들은 아무도 활용할 수가 없었어요. 내가 G마켓에서 상품평 쓴다해도 그게 거기서 그치는 거죠.

그렇지만 만약 DB로 각각을 다 쪼개 놓는다고 생각해보세요. 이미지 따로, 상품정보 따로, 상품평 따로, 판매자정보 따로, 구매자 정보 따로, 가격따로 저장을 하되 연결이 되어 있는 상태로 저장을 해두는 거예요. 옥션도, G마켓도, 아마존도, ebay도 그렇게 한다고 생각해보세요. 그럼 나중에 나는 별모양 비키니를 구매한 정보가 있는 사람들을 연결해서 별모양 비키니 커뮤니티를 만든다거나, 세계 각국의 별모양 비키니 판매상을 엮어서 별모양 비키니를 다 모아갖고 [별모양은 여기 다있다!! : 스타비키니사이트]에서 판매하고, 그 1년 후에는 스타워즈와 전격 제휴! 스타워즈 확장판 비키니를 판매하고 또 그다음에는…..ㅎㅎㅎㅎㅎ ^^;;;

어떤 방식으로든 불러오고 싶은 방식으로 불러와서 새로이 서비스를 만들면 되는겁니다. 무한한 갯수의 서비스가 생기는 거죠. 근데 이거 갠찮네. 스타 비키니 컴퍼니, CEO 제이미 박

 

 

2. 구글

몇 일 전에 Google이 구글의 RDF를 지원한다는 기사가 나왔습니다. 이것은 Linked Data를 이용하는 어떤 기본적인 움직임 중에 하나입니다. RDF를 이용해서 데이터를 구조화시키는데 구글이라는 major가 관심을 보였다는 것은 연결된 Data들을 통해 고객들이 더 나은 정보들을 습득할 수 있게 되었다는 것이구요. 예를들면 아래와 같이 다른 사이트에 있었던 상품평이라든지 가격, 이런 여러 컨텐츠들이 구글검색결과에 나오는 거죠.

구글이 이런 일들을 시작했다는 것은 어느 다른 누가 시작한 것보다 더 훨씬 의미있는 일일겁니다. 

여기에 대해서,  RDF나 그런것들은 저는 개발자가 아니어서 세세히는 모르겠는데, 더 전문적인 이야기는 여기 이 페이지를 참고해주세요.  

 

 

한국 Web도 수천송이의 꽃을 피우게 하고 싶습니다!

많은 분들이 한국의 웹토양에 대해 우려하고 있는 것이, 우리의 토양이 한두송이의 거대한 꽃만 피우는 토양이기 때문입니다. 지난주에 구글과 다음, 싸이월드, 파란 등의 사이트에서 오픈소셜에 참여한다고 발표했습니다. 비록 네이버는 참여하지 않았다지만, 그리고 조금은 늦은감도 있지만, 이렇게 함께 더 풍요로운 미래웹을 만들려는 시도가 있다는 것은 참으로 반가운 일입니다. 꼭 화이팅 하십시오!!!!!

그러니까,  우리나라도 어떻게? 

6

이제부터는 꼭! 한국웹들도 가공안한 Data를 줘야대!!!!!!!!!!!

웹서비스를 만드는 분들이나 기획하시는 분들이 이런 생각을 공유하고 만든다면,

풍성하고 넓은 웹의미래가 더 빨리 올거라고 생각합니다. Raw Data Now!!!

(이거 꼭 제리맥과이어에서 쿠바구딩주니어가 “Show me the money!!” 이러는거 같지 않아요? ㅎㅎ)

 

오역은 덧글로 ^^ 

 

[Reference]

Linked Data is Blooming: Why You Should Care

Understanding the New Web Era: Web 3.0, Linked Data, Semantic Web      

Linked Data: Principles and State of the Art

Advertisements
  1. 좋은 글 감사드립니다. 최근에 많은 관심을 끌고 있는 Cloud Computing과의 연관성에 대한 글도 써 주시면 감사하겠습니다.

  2. 많이 공부해서 빨리 써볼게요!!! ㅎㅎㅎ
    워낙 덧글이 없는 블로그라 굉장히 반갑습니다. ^^
    또 오세요 ;-)

  3. 위 경우에 궁금한게..

    1. 각 데이터 소스를 제공하는 업체들의 수익은 어떻게 보장되는가? 데이터를 저장하고 있다가 전송해주는데는 나름 많은 비용이 들어갑니다. 그 비용을 어떻게 보상해줄지가 감이 안오네요..

    2. 만약 제 서버에 조그마한 이미지를 그런식으로 풀어놨는데, 그 이미지가 덜컥 네이버 첫화면에 올라가버립니다. 그럼… 1시간 내로 제 서버는 뻗어버리겠죠. 네이버 트래픽을 제 서버가 감당할 리가 없을테니… 그렇다고 제 서버의 이미지 파일을 네이버 서버로 옮겨버린다면.. 그건 또 저작권 침해의 소지가 있구요.

    뭐.. 누구나 자유롭게 그리고 무료로 사용할 수 있는 저장공간이 무제한으로 존재한다면 다 해결될 문제들일까요?^^; .. ( 발생하는 수익의 공평한 share 도 ..;; )

    암튼 재미있는 글 잘 읽었습니다~

  4. 1. 수익분배를 할수도 있을것 같아요. 만약 그 데이터소스로 돈을 벌게 된다면요. 건당얼마라던가, %로 분배한다던가요.

    2. Linked Data가 server의 문제까지 고민한건지는 저도 잘 모르겠네요 ^^ Tim Berners-Lee는 단순히 공개, 공유, 연결하는 방법을 제시한 것이라서요.
    그리고 Linked Data가 누구나 아무제한없이 다 쓰라고 한건 아닐겁니다. 상호간의 합의가 있어야겠죠. 내가 너의 Data를 쓰겠다라는 혹은 내 것을 너의 서버로 옮겨도 좋다는

    구글 같은데서는 자기가 저장을 하겠죠? yahoo가 지금 SearchMonkey에서 하는 방식이 어떤 방식인지 모르겠지만 적어도 공유하는 과정이 많아짐에 따라,
    시행착오를 거쳐서 해결방법을 찾지 않을까요?

    덕분에 더 깊게 생각해보게되었네요. 감사합니다.

  5. 네이버도 같이 참여 한다면 문화가 금방 바뀔 것 같은데 말이죠…아쉽습니다.

  6. Naver도 뭔가 하고 있을거라고, 고민하고 있을거라고 생각해요.
    그렇게 많은 사람들이 있는 곳에서 아무고민없이 있을수는 없을거예요. ^^

답글 남기기

아래 항목을 채우거나 오른쪽 아이콘 중 하나를 클릭하여 로그 인 하세요:

WordPress.com 로고

WordPress.com의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Twitter 사진

Twitter의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Facebook 사진

Facebook의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

Google+ photo

Google+의 계정을 사용하여 댓글을 남깁니다. 로그아웃 / 변경 )

%s에 연결하는 중

%d 블로거가 이것을 좋아합니다: