<?xml version="1.0" encoding="UTF-8"?>
<rss version="2.0">
	<channel>
		<title>Agile2Robust</title>
		<link>http://agile2robust.com/tc/</link>
		<description>Be agile to be robust</description>
		<language>ko</language>
		<pubDate>Thu, 11 Jun 2009 15:31:33 +0900</pubDate>
		<generator>Textcube 1.7.8 : Con moto</generator>
		<image>
		<title>Agile2Robust</title>
		<url>http://agile2robust.com/tc/attach/1/5825197428.png</url>
		<link>http://agile2robust.com/tc/</link>
		<width>101</width>
		<height>128</height>
		<description>Be agile to be robust</description>
		</image>
		<item>
			<title>Reflect - 단백질과 small molecule 이름에 링크를</title>
			<link>http://agile2robust.com/tc/57</link>
			<description>&lt;p&gt;&lt;a href=&quot;http://reflect.ws&quot;&gt;Reflect&lt;/a&gt;라는 프로그램이 있다. 웹 페이지 안에 있는 단백질 혹은 small molecule의 이름에 자동으로 링크를 걸어주는 파이어폭스용 플러그인이다. &lt;a href=&quot;http://string.embl.de/&quot;&gt;String&lt;/a&gt;과 &lt;a href=&quot;http://stitch.embl.de/&quot;&gt;Stitch&lt;/a&gt; 데이터베이스 안에 들어있는 항목들에 대해서 링크를 걸어주는 것이다.&lt;/p&gt;

&lt;p&gt;이 프로그램은 &lt;a href=&quot;http://www.embl.de/&quot;&gt;European Molecular Biology Laboratory&lt;/a&gt;에서 개발이 되었으며 &lt;a href=&quot;http://www.elseviergrandchallenge.com/&quot;&gt;Elsevier Grand Challenge&lt;/a&gt;에서 1등을 차지함으로서 $35,000의 상금을 얻은 프로젝트가 되었다.&lt;/p&gt;

&lt;p&gt;말보다는 한 장의 스크린샷이 도움이 될 터...&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://www.flickr.com/photos/lordmiss/3606280375/&quot;  title=&quot;Flickr에서 lordmiss님의 reflect website&quot;&gt;&lt;img src=&quot;http://farm4.static.flickr.com/3105/3606280375_0d164b0bbd.jpg&quot; width=&quot;500&quot; height=&quot;426&quot; alt=&quot;reflect website&quot; /&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://reflect.ws&quot;&gt;Reflect의 웹사이트&lt;/a&gt; 모습이다. 아주 간단하다. 다운로드 링크와 About 페이지 정도가 전부. 현재는 파이어폭스만을 지원하고 있다. 아마 앞으로도 다른 브라우저를 지원하는 것은 쉽지 않을 듯.&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://www.flickr.com/photos/lordmiss/3607100090/&quot;  title=&quot;Flickr에서 lordmiss님의 reflect button in firefox&quot;&gt;&lt;img src=&quot;http://farm4.static.flickr.com/3340/3607100090_3644224f8f.jpg&quot; width=&quot;500&quot; height=&quot;41&quot; alt=&quot;reflect button in firefox&quot; /&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;이 추가 기능을 추가하면 툴바에 Reflect 버튼이 생긴다. 이 버튼 역시 기능은 간단하다.&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://www.flickr.com/photos/lordmiss/3606280651/&quot;  title=&quot;Flickr에서 lordmiss님의 reflect setting&quot;&gt;&lt;img src=&quot;http://farm4.static.flickr.com/3340/3606280651_34d892c4d7.jpg&quot; width=&quot;500&quot; height=&quot;306&quot; alt=&quot;reflect setting&quot; /&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;사실 Preference 메뉴에서는 특정 organism을 선택할 수 있는 기능이 전부이다. 보통은 특별히 연구 목적이 있지는 않은 한 초기 설정을 바꿀 필요는 없을 것이다.&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://www.flickr.com/photos/lordmiss/3607100350/&quot;  title=&quot;Flickr에서 lordmiss님의 After installing reflect&quot;&gt;&lt;img src=&quot;http://farm4.static.flickr.com/3383/3607100350_54577cc05a.jpg&quot; width=&quot;500&quot; height=&quot;426&quot; alt=&quot;After installing reflect&quot; /&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;Reflect를 설치한 후 firefox에서 &lt;a href=&quot;http://en.wikipedia.org/wiki/Lipitor&quot;&gt;Wikipedia의 Lipitor 페이지&lt;/a&gt;로 이동한 후 reflect 버튼을 눌렀을 때의 화면이다. 약 이름 혹은 단백질 이름에 (검색 결과와 같은) 하이라이트를 보여준다. 이런 방식으로 브라우저에서 보이는 모든 약 이름과 단백질 이름을, 정보를 담고 있는 링크로 바꾸어준다.&lt;/p&gt;

&lt;p&gt;그리고 이 링크를 클릭하면 자그마한 창이 뜨면서 해당 내용과 관련된 정보를 보여준다. 해당 창에 어떤 내용이 보이는지에 대해서는 &lt;a href=&quot;http://reflect.ws/help.html&quot;&gt;Reflect 도움말 페이지&lt;/a&gt;에서 볼 수 있다. 이 페이지에서는 아래와 같은 내용을 볼 수 있을 것이다.&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://www.flickr.com/photos/lordmiss/3616295334/&quot;  title=&quot;Flickr에서 lordmiss님의 reflect05&quot;&gt;&lt;img src=&quot;http://farm4.static.flickr.com/3330/3616295334_ba628fc274.jpg&quot; width=&quot;500&quot; height=&quot;448&quot; alt=&quot;reflect05&quot; /&gt;&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;과학에 있어 링크가 얼마나 중요한 것이던가. 이런 움직임들이 계속해서 보여진다는 것은 &lt;a href=&quot;http://depth-first.com/articles/2009/05/04/science-doesnt-need-journals&quot;&gt;과학계가 얼마나 소통에 목마른가&lt;/a&gt;를 보여주는 것이 아닐 수 없다.&lt;/p&gt;
&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>화학정보학</category>
			<category>reflect</category>
			<category>small molecule</category>
			<category>단백질</category>
			<category>링크</category>
			<category>소통</category>
			<category>파이어폭스</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/57</guid>
			<comments>http://agile2robust.com/tc/57#entry57comment</comments>
			<pubDate>Mon, 08 Jun 2009 23:05:30 +0900</pubDate>
		</item>
		<item>
			<title>Rio - 단순한 아름다움</title>
			<link>http://agile2robust.com/tc/56</link>
			<description>&lt;p&gt;&lt;a href=&quot;http://www.ruby-lang.org&quot;&gt;루비&lt;/a&gt;는 매우 우아한 언어이다.&lt;/p&gt;

&lt;pre&gt;&lt;code class=&#039;ruby&#039;&gt; 3.times {print &quot;Hello Ruby&quot;}
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;위의 코드는 “Hello Ruby”라는 문자열을 세 번 출력해 준다. 이 정도 되면 루비는 사람의 마음을 잘 이해하고 있다고 해야 할 것이다. 그래서 나는 루비를 배웠고, 그걸 잘 써먹고 있다.&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://zinc.docking.org&quot;&gt;Zinc&lt;/a&gt;에서 화합물 데이터베이스 파일을 전부 다운로드받아야 하는 일이 생겼다. 단순하게 0부터 순서대로 160여개의 파일이 있는데, 개당 약 30메가 정도의 크기이고 그걸 다 다운받으면 되는 일이다. 어플리케이션으로 한다면 다운로드 매니저를 쓰면 되고, 유닉스 스타일로 한다면 curl이나 wget으로 간단하게 해결되는 일이지만, 루비로 이 일을 해 보기로 했다. 기본적으로는 웹에서 파일을 다운받는 것이니만큼 net/http 기능을 사용해서 하는 것으로 생각을 했다. 그런데 이게 생각보다 코드가 예쁘지 않고 직관적이지도 않은게 좀 마음에 들지 않는 것이다. 누군가는 분명 이런 문제에 대해 답을 가지고 있을 것이라는 생각으로 검색을 좀 해 봤고, 결국 &lt;a href=&quot;http://rio.rubyforge.org&quot;&gt;Rio&lt;/a&gt;라는 프로그램을 찾을 수 있었다.&lt;/p&gt;

&lt;p&gt;위에서 이야기한 &lt;a href=&quot;http://zinc.docking.org&quot;&gt;Zinc&lt;/a&gt;에서 다운받기는 아래와 같은 12줄짜리 스크립트로 해결할 수 있었다.&lt;/p&gt;

&lt;pre&gt;&lt;code class=&#039;ruby&#039;&gt;require &#039;rubygems&#039;
require &#039;rio&#039;

def get_sdfgz(url, res)
    rio(url) &gt; rio(res) #url의 파일을 res 파일로 저장
end

for number in 0..165
    name = &quot;http://zinc.docking.org/subset1/6/6_p0&quot; + number.to_s + &quot;.sdf.gz&quot;
    res = number.to_s + &quot;.sdf.gz&quot;
    get_sdfgz(name, res)
end
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;특히 다섯번째 줄의 rio(url) &gt; rio(res) 같은 경우에는 정말 아름답지 않은가! 이런 코드로 일을 할 수 있다는건 참 행복이 아닐 수 없다.&lt;/p&gt;

&lt;p&gt;알고보니 Rio의 기능은 이 정도에서 끝나는 것이 아니었다. 다음과 같은 예도 가능하다.&lt;/p&gt;

&lt;pre&gt;&lt;code class=&#039;ruby&#039;&gt;rio(&#039;dir&#039;).files(*.jpg) { |jpg| ... } # dir 디렉토리에 있는 모든 jpg 파일에 대해 작업
rio(&#039;dir&#039;).files[&#039;*.txt&#039;] # dir 디렉토리에 있는 모든 txt 파일의 array
rio(&#039;a.txt&#039;) &gt; string # a.txt 파일의 내용을 string 변수에 복사
rio(&#039;file&#039;).lines[0..3,/re/] # file의 처음 세 줄에 대해 정규표현식을 적용
rio(&#039;ftp://host/file.gz&#039;).gzip.lines[0,3..5] # file.gz의 압축을 푼 후, 0, 3-5 라인을 array에 넣음
ans = rio(?-).print(&quot;Input: &quot;).chomp.gets # 사용자 입력을 받아 ans에 돌려줌
&lt;/code&gt;&lt;/pre&gt;

&lt;p&gt;위의 예제 정도면 rio가 얼마나 일을 편하게 만들어주는지를 알 수 있을 것이다. 더 많은 예제와 사용법을 원하신다면 홈페이지를 방문해 보시길. &lt;strong&gt;단순한 것이 아름답다&lt;/strong&gt;는 것을 느끼게 될 것이다.&lt;/p&gt;

&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>화학정보학</category>
			<category>Rio</category>
			<category>ruby</category>
			<category>다운로드</category>
			<category>단순함</category>
			<category>루비</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/56</guid>
			<comments>http://agile2robust.com/tc/56#entry56comment</comments>
			<pubDate>Mon, 12 Jan 2009 19:59:45 +0900</pubDate>
		</item>
		<item>
			<title>&quot;대학생을 위한 과학 통계 및 워크플로우 엔진 활용&quot; 교육 안내</title>
			<link>http://agile2robust.com/tc/55</link>
			<description>제가 근무하는 (사)분자설계연구소에서 다음과 같이 교육을 개최합니다. 관심 있으신 분들의 많은 참여를 부탁드립니다.&lt;div&gt;&lt;br&gt;&lt;/div&gt;&lt;blockquote&gt;&lt;div&gt;제목 : 대학생을 위한 과학 통계 및 워크플로우 엔진 활용&lt;/div&gt;&lt;div&gt;일시 : 2008년 1월 7~9일&lt;/div&gt;&lt;div&gt;장소 : 연세대학교 공학원 B118호 교육장&lt;/div&gt;&lt;div&gt;&lt;a href=&quot;http://edu.e-drugdiscovery.com/schedule/schedule_view.php?idx=84&quot;  target=&quot;_blank&quot;&gt;수강신청 링크&lt;/a&gt;&lt;/div&gt;&lt;div&gt;수강료 : 연세대학교 학생 무료, 대학(원)생 30만원, 국공립 연구소 40만원, 회사 50만원&lt;/div&gt;&lt;/blockquote&gt;&lt;div&gt;&lt;br&gt;&lt;/div&gt;&lt;div&gt;이 교육에서는 대표적인 데이터 시각화 프로그램인 &lt;a href=&quot;http://spotfire.tibco.com&quot;  target=&quot;_blank&quot;&gt;Spotfire&lt;/a&gt;, 워크플로우 엔진인 &lt;a href=&quot;http://www.inforsense.com&quot;  target=&quot;_blank&quot;&gt;InforSense&lt;/a&gt;, &lt;a href=&quot;http://accelrys.com/products/scitegic/&quot;  target=&quot;_blank&quot;&gt;Pipeline Pilot&lt;/a&gt;, 그리고 통계를 위한 오픈 소스 프로그램인 &lt;a href=&quot;http://www.r-project.org&quot;  target=&quot;_blank&quot;&gt;R&lt;/a&gt;, &lt;a href=&quot;http://www.cs.waikato.ac.nz/ml/weka/&quot;  target=&quot;_blank&quot;&gt;WEKA&lt;/a&gt;가 다루어집니다. 이외에도 오픈소스 워크플로우 엔진인 &lt;a href=&quot;http://www.taverna.org&quot;  target=&quot;_blank&quot;&gt;Taverna&lt;/a&gt;, &lt;a href=&quot;http://www.knime.org&quot;  target=&quot;_blank&quot;&gt;KNIME&lt;/a&gt; 등에 대해 언급이 있을 예정이며, 교육의 내용은 주로 신약 개발과 관련된 Life Science 위주로 다루어집니다.&lt;/div&gt;&lt;div&gt;&lt;br&gt;&lt;/div&gt;&lt;div&gt;수강료 때문에 문제가 되시는 분들도 계실 것입니다. 그런 분들은 따로 제게 연락(메일 lordmiss_AT_lordmiss.com 블로그에서 본 사실을 이야기해 주세요)을 해 주시면 최대한 상황을 고려해 드리도록 하겠습니다. 반드시 위의 수강신청 링크에 수강 신청을 하셔야 합니다.&lt;/div&gt;&lt;div&gt;&lt;br&gt;&lt;/div&gt;&lt;div&gt;누군가에게는 도움이 되는 소식이면 좋겠습니다.&lt;/div&gt;&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>기타</category>
			<category>InforSense</category>
			<category>Pipeline Pilot</category>
			<category>R</category>
			<category>Spotfire</category>
			<category>WEKA</category>
			<category>교육</category>
			<category>오픈소스</category>
			<category>워크플로우</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/55</guid>
			<comments>http://agile2robust.com/tc/55#entry55comment</comments>
			<pubDate>Sat, 03 Jan 2009 14:02:14 +0900</pubDate>
		</item>
		<item>
			<title>sdf 파일의 여러 줄 데이터 처리하기</title>
			<link>http://agile2robust.com/tc/54</link>
			<description>&lt;p&gt;&lt;a href=&quot;http://code.google.com/p/mx-java/&quot;&gt;MX&lt;/a&gt;는 &lt;a href=&quot;http://depth-first.com&quot;&gt;Rich Apodaca&lt;/a&gt;가 개발하고 있는 가벼운 화학정보학 툴킷이다. 이 툴킷은 화학 구조와 데이터 파일의 표준이라고도 말할 수 있는 sdf 파일을 읽고 쓰는데 사용될 수 있음을 &lt;a href=&quot;http://depth-first.com/articles/2008/12/15/reading-and-writing-sd-files-with-mx&quot;&gt;이 기사&lt;/a&gt;에서 볼 수 있다. 문제는 해당 기사에 내가 코멘트를 남긴 것처럼 SDF 파일 안에 여러 줄로 된 데이터가 있을 경우에는 첫 줄만을 읽어온다는 것이다. 이런 현상은 이 프로그램에서만이 아니고 그가 적었던 다른 여러 코드에서도 공통적으로 볼 수 있는 현상이었다. PubChem의 sdf 파일들은 모두 PUBHCEM_BONDANNOTAIONS 라는 이름의 필드에 여러 줄로 된 데이터를 가지고 있기 때문에 나름 문제라고 볼 수 있는 현상이다.&lt;/p&gt;

&lt;p&gt;우리 연구소에서 개발하고 있는 &lt;a href=&quot;http://preadmet.bmdrc.org&quot;&gt;PreADMET&lt;/a&gt;에서는 이런 문제가 없기 때문에, 어떤 방식을 사용하고 있는지 물어봤더니 그냥 매 줄을 읽어서 바로 바로 처리를 한다는 말을 들었다. 그러면 빈 줄이 나와야만 데이터가 끝났다고 생각하기 때문에 여러 줄로 된 데이터를 읽는데 문제가 없게 된다.&lt;/p&gt;

&lt;p&gt;곰곰히 생각을 해 봤더니, 데이터 부분에서 “\n” 두 개가 있으면 필드를 나눌 수 있는 셈이다. 그래서 그냥 “\n\n”로 필드 별로 나눠버리고 정규식을 쓰면 이름과 데이터 짝을 쉽게 얻을 수 있겠다는 생각이 들었다. 그래서 생각난 김에 &lt;a href=&quot;http://depth-first.com/articles/2006/09/29/hacking-pubchem-direct-access-with-ftp&quot;&gt;Rich Apodaca의 ruby 코드&lt;/a&gt;를 조금 수정해 보았다. 그냥 작동은 하는 수준이지만, 이런 방법을 쓰면 나름 이 문제를 해결할 수 있을 것 같다.&lt;/p&gt;

&lt;p&gt;This is my quick (and dirty) modification of &lt;a href=&quot;http://depth-first.com/articles/2006/09/29/hacking-pubchem-direct-access-with-ftp&quot;&gt;Rich Apodaca’s ruby code&lt;/a&gt; for parsing multi-line data of sdf format file.&lt;/p&gt;

&lt;pre&gt;&lt;code class=&#039;ruby&#039;&gt;
class SDFSplitter
  @@mol_stop = &quot;$$$$\n&quot;
  @@blank = &quot;&quot;
  
  def initialize(filename)
    @sdf = File.new(filename)
  end
  
  def each_record
    record = get_record
    
    while record != (@@blank || &quot;\n&quot;)
      yield record
      record = get_record
    end
  end
  
  def get_record
    line = read_line
    record = [line]

    while !(@@mol_stop.eql?(line) || nil == line)
      line = read_line
      record &lt;&lt; line
    end

    record.join
  end
  
  private
  
  def read_line
    begin
      line = @sdf.readline
    rescue EOFError
      return nil
    end
    line
  end
end

class DataExtractor
  @@desc_stop = &quot;\n\n&quot;
  
  def self.extract_molfile(record)
    record.match(/M  END$/).pre_match + &quot;M  END\n&quot;
  end
  
  def self.extract_data_hash(record)
    hash = {}
    all_data = record.match(/M  END$/).post_match
    pairs = all_data.split(@@desc_stop)
    pairs.delete(&quot;$$$$\n&quot;)
    pairs.each do |pair|
      pair.match(/^&gt;\s+&lt;(.+)&gt;\s*\S*\n(.+)\n/m)
      key, data = $1, $2
      hash[key] = data
    end
    return hash
  end
end
&lt;/code&gt;&lt;/pre&gt;&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>화학정보학</category>
			<category>cheminformatics</category>
			<category>multi-line data</category>
			<category>MX</category>
			<category>ruby</category>
			<category>sdf</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/54</guid>
			<comments>http://agile2robust.com/tc/54#entry54comment</comments>
			<pubDate>Sun, 21 Dec 2008 01:37:20 +0900</pubDate>
		</item>
		<item>
			<title>당신은 과학 문맹이 아니신가요?</title>
			<link>http://agile2robust.com/tc/53</link>
			<description>&lt;p&gt;세계적으로 가장 유명한 주간지의 하나인 &lt;a href=&quot;http://www.time.com/&quot;&gt;TIME&lt;/a&gt;에서 &lt;a href=&quot;http://www.time.com/time/specials/2008/top10&quot;&gt;2008년 모든 것의 Top 10 리스트&lt;/a&gt;를 발표했다. 이 리스트에는 뉴스와 과학, 예술과 연예, 비즈니스와 기술과 스포츠, 대중문화 등 네 개의 분류 하에 모두 50개의 항목이 들어있다.&lt;/p&gt;

&lt;p&gt;그 중에 과학 분야에서 2008년 최고의 발견 10 가지에 관심을 갖고 읽어보았다. 논란이 많이 되었던 가속기, 중국의 우주인 탄생, 화성의 북극 등 다양한 소식들이 있었는데, 내 눈을 끌었던 것은 아홉번째로 언급되고 있는 기사의 제목이었다. &lt;a href=&quot;http://www.time.com/time/specials/2008/top10/article/0,30583,1855948_1863947_1863933,00.html&quot;&gt;Can you spell Science?&lt;/a&gt;&lt;/p&gt;

&lt;p&gt;기사의 내용을 살펴보면, 1979년에서 2006년까지의 기간 동안 &lt;strong&gt;과학적으로 문맹이 아닌 (scientifically literate) 성인&lt;/strong&gt;의 비율이 17%까지 두 배 늘어났다고 한다. 그리고 현재, 미국 성인의 25%가 이 범주에 든다고 한다. 이 말은, 현재 미국 성인 중의 4분의 1만이 뉴욕 타임즈지의 주말판 과학 부분을 읽고 이해할 수 있다는 뜻이다. 수많은 정치인들이 지구 온난화며 줄기 세포며 하는 이야기를 입에 달고 살고 있는 이 21세기에 이런 수치는 자못 놀라운 일이라는 말도 있다.&lt;/p&gt;

&lt;p&gt;뉴욕 타임즈 지의 주말판 과학 부분이라... 지금은 듣고 있지 않지만, 뉴욕 타임즈의 과학 부분 기사를 podcast로 들은 적이 있었다. 그 때 들었던 내용으로 미루어 짐작해 보면 (난 뉴욕 타임즈의 과학 부분을 제대로 읽어본 적이 없지만) 그 내용이라는 것이 그렇게 간단한 내용은 아니었던 것 같다. 다양한 분야에서 최신 연구 결과에 대한 분석이 들어있는 그런 기사는 한국의 매체에서는 접해볼 수 없는 종류의 것이었다. 한국에 어떤 과학 잡지가 있더라? 동아 사이언스, 사이언스 올제, 또...?&lt;/p&gt;

&lt;p&gt;지금의 세계가 과학 기술의 발전에 얼마나 의존적인지 이해하는 사람이라면, 한국 사람들이 과학에 대해 얼마나 관심이 없는지에 대해 놀라게 될 것이다. 오늘 2008 프론티어연구성과대전이라는 행사에 참석을 하고 있는데, 2000년대 대한민국의 대표적인 R&amp;amp;D 사업인 프론티어사업단의 연구 성과를 발표하는 행사인 이 곳에는 귀빈, 연구담당자, 행사 지원자, 그리고 단체 관람을 온 초등학생과 중고생들로 넘쳐난다. 시간적으로 어렵기도 하겠지만, 과학 기술에 관심이 있어서 찾아온 일반인은 단 한 명도 없지 않을까 하는 우울한 예상을 해 본다.&lt;/p&gt;

&lt;p&gt;전 국민에게 줄기세포라는 것을 가르쳐준 황우석 사태 정도가 한국인들이 과학에 관심을 갖게 하는 사건이었던 것 같다. 그리고 해마다 한 번씩 되풀이되는 노벨상 논란.&lt;/p&gt;

&lt;p&gt;과학이 일반인에게 알려지지 않고 전달되지 않는 이러한 현상은 사회적인 문제이기도 하지만, 과학계의 문제라고 볼 수도 있다. 과학계에서 일하는 연구자들 중에 이런 부분이 중요하다고 생각하고 전문적으로 이런 일을 진행하는 사람이 거의 없기 때문이다. 이른바 과학관이라는 곳에서 박사 학위를 받은 전문 연구자들이 자신의 연구 결과를 설명하는 일, 과학의 대중화를 위해 노력하는 프로페셔널들을 찾아볼 수 없는 상황이라면 과학의 대중화라는 것은 언제나 남의 이야기, 꿈과 같은 이야기일 뿐이리라.&lt;/p&gt;
&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>과학 일반</category>
			<category>TIME</category>
			<category>과학</category>
			<category>대중화</category>
			<category>문맹</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/53</guid>
			<comments>http://agile2robust.com/tc/53#entry53comment</comments>
			<pubDate>Thu, 11 Dec 2008 13:50:18 +0900</pubDate>
		</item>
		<item>
			<title>CSV2UFS 0.12 Release</title>
			<link>http://agile2robust.com/tc/52</link>
			<description>&lt;p&gt;&lt;a href=&quot;http://www.port.ac.uk/research/cmd/software/&quot;&gt;UFS&lt;/a&gt;는 &#039;Unsupervised Forward Selection&#039;의 약자로서 relevance, redundancy, 그리고 multicollinearity 등을 고려하여 분자표현자(일반적인 통계용어로는 independent variable)을 선택하는 프로그램이다. 지난 2000년에 &lt;a href=&quot;http://pubs.acs.org/cgi-bin/abstract.cgi/jcisd8/2000/40/i05/abs/ci000384c.html&quot;&gt;논문에 발표&lt;/a&gt;되었으며, 해당 기능을 하는 프로그램도 &lt;a href=&quot;http://www.port.ac.uk/research/cmd/software/&quot;&gt;홈페이지&lt;/a&gt;에 공개되어 있다.&lt;/p&gt;

&lt;p&gt;&lt;a href=&quot;http://www.bmdrc.org&quot;&gt;(사)분자설계연구소&lt;/a&gt;에서 개발한 &lt;a href=&quot;http://preadmet.bmdrc.org&quot;&gt;PreADMET&lt;/a&gt;와 같은 프로그램을 사용해서 많은 수의 분자표현자를 계산한 후에 이를 활용하여 &lt;a href=&quot;http://en.wikipedia.org/wiki/Qsar&quot;&gt;QSAR&lt;/a&gt; 연구를 진행하고자 할 때 가장 문제가 되는 것은 &lt;strong&gt;너무나 많은 분자표현자가 있다&lt;/strong&gt;는 점이다. 어떤 분자표현자를 선택해야 하는가의 문제가 매우 복잡하다는 것이다. 특히 분자의 물리화학적인 성질을 직접 나타내는 분자표현자가 아닌 topological descriptor나 여러 종류의 3D descriptor의 경우에는, 눈으로 봐서는 그 중요도를 알기가 거의 어렵기 때문에 적절한 분자표현자를 골라내는 것이 더욱 어려운 문제가 아닐 수 없다.&lt;/p&gt;

&lt;p&gt;(사실 생각해보면, 분자의 어떤 성질을 결정하는 요소가 수백가지일리는 없으니, PreADMET가 계산하는 2000개 이상의 분자표현자 중에서 실제로 의미를 갖는 것은 몇 퍼센트에 불과할 것이다.)&lt;/p&gt;

&lt;p&gt;이런 경우에 사용할 수 있는 테크닉이 물론 여러 가지 있다. 가장 쉽게는 &lt;a href=&quot;http://en.wikipedia.org/wiki/Genetic_algorithm&quot;&gt;유전 알고리즘&lt;/a&gt;을 사용할 수 있을 것이고, 이 외에도 몇 가지 방법들이 있다. 그렇지만 여전히 수천개의 분자표현자로부터 이런 방법을 쓰는 것은, 굉장히 큰 컴퓨터 자원을 사용해야만 가능할 것이기 때문에, 이런 방법들을 사용하기 이전에 의미있는 분자표현자의 개수를 줄여놓는 것은 실용적으로 매우 중요한 일이다. 그리고 이런 일을 위해서 &lt;a href=&quot;http://www.port.ac.uk/research/cmd/software/&quot;&gt;UFS&lt;/a&gt;가 만들어졌다고 볼 수 있다.&lt;/p&gt;

&lt;p&gt;문제는 이 프로그램이 자체적인 형식의 input 파일을 요구한다는 점이다. 이 형식이라는게 아주 간단하기는 하지만, 매번 그에 맞춰서 input 파일을 만드는 것도 귀찮은 일이 아닐 수 없다. 얼마 후에 있을 분자설계 교육에서 QSAR 강의를 맡았고, 실습 내용을 구성하는데 있어서 UFS를 사용하기로 했는데, 이 부분에서 막혀버렸다. 어쩔 수 없이 csv 파일을 ufs input 파일로 변경해주는 간단한 프로그램을 만들었다. 프로그램의 이름은 당연히 &lt;strong&gt;CSV2UFS&lt;/strong&gt;가 될 수 밖에.&lt;/p&gt;

&lt;p&gt;대충 만든 코드지만 잘 동작을 했다. &lt;a href=&quot;http://www.erikveen.dds.nl/rubyscript2exe/&quot;&gt;Rubyscript2exe&lt;/a&gt;를 사용해서 도스용 프로그램을 만들어 봤는데 동작을 잘 했다. 결국, 실습 시간에는 이 도스용 프로그램을 사용하기로 했다.&lt;/p&gt;

&lt;p&gt;가만 생각해보니, 이렇게 가끔씩 만드는 코드들을 쓸데없이 버리지 말고 잘 관리해봐야겠다는 생각이 들었다. 개인적으로 subversion을 사용하기는 하는데, 굳이 혼자만 봐야 할 필요는 없는거고 해서 &lt;a href=&quot;http://code.google.com&quot;&gt;구글 코드&lt;/a&gt;에 &lt;a href=&quot;http://code.google.com/p/cheminformatics-snippets/&quot;&gt;cheminformatics-snippets&lt;/a&gt;라는 이름의 프로젝트를 만들고 거기에 넣어두기로 했다. 라이센스 때문에 0.5초 정도 고민을 했는데, 처음에는 &lt;a href=&quot;http://en.wikipedia.org/wiki/BSD&quot;&gt;BSD license&lt;/a&gt;로 하려다가 별 이유없이 &lt;a href=&quot;http://en.wikipedia.org/wiki/GPL&quot;&gt;GPL&lt;/a&gt;로 하기로 했다. 0.12 버전에서도 필요한만큼은 동작을 한다. 물론 테스트도 제대로 되어 있지 않고, 에러 처리 부분이라는게 거의 없어서 내놓기 민망하기는 하지만, 악의없는(!) 정상적인 환경에서라면 해야 할 일은 제대로 할 것이다.&lt;/p&gt;

&lt;p&gt;코드를 받기 위해서는 아래와 같이 실행하면 된다.&lt;/p&gt;

&lt;pre&gt;&lt;code class=&#039;no-highlight&#039;&gt;svn checkout http://cheminformatics-snippets.googlecode.com/svn/trunk/ cheminformatics-snippets-read-only&lt;/code&gt;&lt;/pre&gt;
&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>화학정보학</category>
			<category>CSV</category>
			<category>descriptor</category>
			<category>GPL</category>
			<category>QSAR</category>
			<category>ruby</category>
			<category>UFS</category>
			<category>구글코드</category>
			<category>분자표현자</category>
			<category>화학정보학</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/52</guid>
			<comments>http://agile2robust.com/tc/52#entry52comment</comments>
			<pubDate>Thu, 06 Nov 2008 15:42:54 +0900</pubDate>
		</item>
		<item>
			<title>문헌 정리 소프트웨어에 대한 생각</title>
			<link>http://agile2robust.com/tc/51</link>
			<description>&lt;p&gt;문헌 정리를 잘 하는 것은 모든 연구자에게 있어서 매우 중요한 일이다. &lt;strong&gt;연구 결과는 오직 논문으로서만 말할 수 있기 때문이다.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;내가 처음 대학원에 들어간 90년대 후반에만 해도 문헌 검색을 인터넷으로 하는 것은 생각도 하지 못했고, 거의 &lt;a href=&quot;http://www.cas.org&quot;&gt;Chemical Abstract&lt;/a&gt; 책을 뒤져야만 했다. 학부 때 배웠던 논문 검색법 수업에서도 도서관에서 어떻게 &lt;a href=&quot;http://www.cas.org&quot;&gt;Chemical Abstract&lt;/a&gt; 책을 봐야 하는지에 대해 배웠던 것 같다. 이 책이 한 주에 나오는 분량만 해도 웬만한 백과사전 몇 권 분량이었기 때문에 나에게 이 책을 뒤지는 것이 힘든 일이었지만, 도서관으로서도 이런 분량의 책을 매주 배달받아서 분류하는 작업을 한다는 것이 매우 어려운 일이었을 것이다.&lt;/p&gt;

&lt;p&gt;그러다가 어느 때였는지부터 이게 시디롬으로 바뀌기 시작했다. 시디롬을 빌려줄 수는 없는만큼, 도서관 컴퓨터에 시디롬들을 삽입해 놓고 인터넷으로 이 컴퓨터에 접속해서 검색을 하는 방식이었다. 아무래도 두꺼운 책을 직접 찾는 것보다는 훨씬 효율적인 일이었지만, 한 컴퓨터에 기껏해야 24장의 시디롬을 넣을 수 밖에 없는 일이니 (지금이야 파일을 마운트하는 것이 가능하지만 그 때만 해도 시디롬을 사용하는 방법은 D부터 Z까지 실제 물리적인 드라이브에 시디를 넣는 방법 뿐이었다), 시디롬이 늘어나면 컴퓨터를 늘려야 했고 (일년에 시디가 몇 장 나온다고 생각해도 문헌 검색은 몇십년을 해야 하니...), 시디롬을 직접 읽으면서 검색을 해야 하니 속도 면에서도 그리 좋지 않을 수 밖에 없었다. (2배속 시디롬... -_-)&lt;/p&gt;

&lt;p&gt;더 문제는 이렇게 검색을 하고 나면 반드시 해당 문헌을 도서관에서 직접 찾아야 한다는 점이었다. 논문을 책으로부터 직접 찾으려면 저널이 제자리에 잘 꽂혀 있는 것 자체가 엄청나게 중요한 문제일 뿐더러, 모든 정보들을 복사지에 의존해서 종이 내에 관리를 해야 했기 때문에, 그야말로 부지런하게 검색하고 복사하고, 복사한 논문을 제본하고 하는 사람이 유리할 수 밖에 없는 상황이었다. 이렇게 논문 제본한 책들이 늘어날수록 정보 검색의 효율성이 떨어지는 것은 어쩔 수 없는 일이었고, 어떻게든 검색에 유리하게 이 자료들을 관리하는 것이 하나의 중요한 노하우였다.&lt;/p&gt;

&lt;p&gt;그러던것이 &lt;a href=&quot;http://scientific.thomsonreuters.com/products/wos/&quot;&gt;Web of Science&lt;/a&gt;와 같은 서비스가 가능해지면서 어느덧 아득한 과거의 추억이 되고 말았다. 이제 어느 누구도 저널의 논문을 찾기 위해 도서관을 찾아가지는 않는다. 다만 웹 브라우저를 열고 검색 사이트에 접속하여 검색을 할 뿐이다. 검색 결과가 나오면 해당 저널 페이지로 이동해서 html이나 pdf로 된 원문을 읽으면 된다. 이제 &lt;a href=&quot;http://scholar.google.com&quot;&gt;Google Scholar&lt;/a&gt; 같은 서비스까지 나왔으니 검색이 그 어느때보다 쉬운 일이 된 것이다.&lt;/p&gt;

&lt;p&gt;그러나 문헌 정보를 검색하기가 너무 쉬워진 요즘이라고 해도 &lt;strong&gt;검색한 정보들을 효율적으로 정리하는 것은 또다른 문제&lt;/strong&gt;가 아닐 수 없다. 문헌 정보를 이용하는 것은 논문을 읽기 위한 목적도 있지만 궁극적으로는 내가 논문을 쓸 때 제대로 인용하기 위해서라고 볼 수 있는데, 이렇게 논문을 쓸 때 인용을 제대로 하기 위해서는 내가 수집한 문헌 정보들을 찾기 쉽게 잘 정리해 두어야 하기 때문이다. 게다가 저널마다 다른 인용 방식을 자동으로 관리해준다면 더이상 바랄 것이 없을 것이다. 인용 방식이 다른 저널에 투고를 하게 되어서 Reference의 인용 방식을 바꿔본 일이 있는가? 특히 Review 논문처럼 인용문헌이 수백개에 달하는 경우라면, 이렇게 인용 방식을 바꾸는 일은 그야말로 세상에서 가장 멍청하고 지루한 일이다. 그리고 이런 지루한 일을 줄여 주었던 혁신적인 소프트웨어가 바로 &lt;a href=&quot;http://www.endnote.com/&quot;&gt;Endnote&lt;/a&gt;였다.&lt;/p&gt;

&lt;p&gt;이제 웬만한 대학 도서관에서는 Endnote를 학생과 교직원들에게 무료로 제공하고 있고, 많은 사용자들이 이 프로그램을 사용해서 논문을 쓰고 있다.&lt;/p&gt;

&lt;p&gt;그러나 어디든 영원한 승자는 없는 법. Endnote의 단점인 무거움, pdf 관리의 어려움 등을 개선한 많은 소프트웨어들이 출현을 하고 있다. 내 경우에는 &lt;a href=&quot;http://bibdesk.sourceforge.net&quot;&gt;BibDesk&lt;/a&gt;라는 프로그램을 가장 먼저 사용하다가, 이제는 &lt;a href=&quot;http://mekentosj.com/papers/&quot;&gt;Papers&lt;/a&gt;라는 프로그램을 쓰고 있고, 얼마 전에는 &lt;a href=&quot;http://www.sonnysoftware.com&quot;&gt;Bookends&lt;/a&gt;라는 프로그램을 더 추가하여 사용하고 있다. &lt;a href=&quot;http://bibdesk.sourceforge.net&quot;&gt;BibDesk&lt;/a&gt;는 인용 문헌 관리는 물론이고 pdf 파일 관리에 있어서도 많은 자유도를 부여해 주는 소프트웨어이다. &lt;a href=&quot;http://mekentosj.com/papers/&quot;&gt;Papers&lt;/a&gt;는 주로 논문을 검색해서 읽는 작업 흐름에 최적화되어 있는 프로그램이고, &lt;a href=&quot;http://www.sonnysoftware.com&quot;&gt;Bookends&lt;/a&gt;는 문헌을 내 논문에 인용하고 싶을 때 강력한 힘을 발휘한다. 물론 이런 모든 일들을 TeX으로 작업하는 것도 좋은 방법 중의 하나이다.&lt;/p&gt;

&lt;p&gt;그런데, 최근에 웹 브라우저인 &lt;a href=&quot;http://www.mozilla.com/en-US/firefox/&quot;&gt;Firefox&lt;/a&gt;의 플러그인으로 작동하는 &lt;a href=&quot;http://www.zotero.org/&quot;&gt;Zotero&lt;/a&gt;라는 프로그램이 나오면서 이러한 혁신의 가장 진보된 모습을 보게 되었다. &lt;a href=&quot;http://www.zotero.org/&quot;&gt;Zotero&lt;/a&gt;는 &lt;strong&gt;문헌을 검색해서 읽고 관리하는 모든 일들이 대부분 웹 브라우저 안에서 이루어진다는 사실에 착안하여, 웹 브라우저 안에서 이 모든 일을 할 수 있도록 해 준다.&lt;/strong&gt; 브라우저와 플러그인만 있으면 문헌 관리와 관련된 모든 것을 다 할 수 있는 것이다. 원하는 논문을 담고 있는 웹 페이지에 가면 자동 추가 버튼이 생기고, 이것을 누르면 모든 문헌 정보가 저장되는 것이다. 여기에 첨부 파일들도 제한없이 관리할 수 있고, 자체 플러그인 기능을 이용해서 주요한 워드 프로세서 프로그램들과도 연동이 되어, 서로 다른 문헌 인용 방식을 자유롭게 쓸 수 있게 해 준다.&lt;/p&gt;

&lt;p&gt;최근에 Endnote를 만들고 있는 &lt;a href=&quot;http://www.thomsonreuters.com/&quot;&gt;Thomson Reuters&lt;/a&gt;사에서 Zotero 제작자인 조지메이슨 대학의 &lt;a href=&quot;http://chnm.gmu.edu/&quot;&gt;Center for History and New Media&lt;/a&gt;에 &lt;a href=&quot;http://www.courthousenews.com/2008/09/17/Reuters_Says_George_Mason_University_Is_Handing_Out_Its_Proprietary_Software.htm&quot;&gt;천만달러짜리 소송을 제기했다는 뉴스&lt;/a&gt;를 들을 수 있었다. 이게 웬일인가 하는 생각이 절로 들 수 밖에 없어서, 내용을 봤더니 Endnote의 독점적 파일 포맷을 침해했다는 이유라고 한다. 이제 마이크로소프트마저 오피스 파일 포맷을 공개하고 있는 상황에서, 게다가 위에서 언급한 수많은 대안들이 존재하는 상황에서 이런 소송의 이유라는건 참 납득하기 힘든 일이 아닐 수 없다.&lt;/p&gt;

&lt;p&gt;어찌되었건간에, 나와 같은 사용자들에게는 이런 소송 뉴스가 도리어 &lt;a href=&quot;http://www.zotero.org/&quot;&gt;Zotero&lt;/a&gt;에 대한 선전이 되어서 다운로드받고 실행을 해 보게 되었다. 아직 논문 안에 문헌 인용을 해 본 것은 아니지만 이 정도의 완성도와 직관적인 사용 흐름이라면 충분히 기존의 문헌 정리 프로그램들을 대치할 수 있을거라는 생각이 들었다. 게다가 이 프로그램은 오픈소스이다. 도서관에서 Endnote를 무료로 받아서 사용하는 학생들이라면 Endnote도 무료라고 생각할 수 있지만, 사실 도서관이 지불하고 있을 어마어마한 돈을 생각하면 그렇지도 않다. 게다가 개인 사용자용의 경우에는 꽤 비싼 비용을 지불해야 한다. 왜? 나로서는 비싸고 느리고 기능도 그리 좋지 않으면서 독점적인 파일 형식을 사용하는 프로그램을 굳이 써야 할 이유를 찾을 수가 없다. 아직은 &lt;a href=&quot;http://mekentosj.com/papers/&quot;&gt;Papers&lt;/a&gt; + &lt;a href=&quot;http://www.sonnysoftware.com&quot;&gt;Bookends&lt;/a&gt; 조합에 만족하고 있지만, &lt;strong&gt;플랫폼 비의존적인 방법을 찾아야 하는 상황이라면 당연히 &lt;a href=&quot;http://www.zotero.org/&quot;&gt;Zotero&lt;/a&gt;가 첫번째 선택이 될 것이다.&lt;/strong&gt;&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;덧붙이는 말&lt;/strong&gt; : &lt;a href=&quot;http://dx.doi.org/10.1038/455708a&quot;&gt;Nature에 실린 기사&lt;/a&gt;에서 이에 대해 이렇게 명확한 정리를 해 주고 있다.&lt;/p&gt;

&lt;blockquote&gt;독점적인 데이터 포맷을 법적으로 보호할 수 있을지는 몰라도, 열린 표준은 혁신을 위해 더 나은 자극이 될 수 있다.&lt;br /&gt;
Proprietary data formats may be legally defensible but open standards can be a better spur for innovation.&lt;/blockquote&gt;&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>소프트웨어</category>
			<category>bookends</category>
			<category>endnote</category>
			<category>papers</category>
			<category>zotero</category>
			<category>문헌</category>
			<category>소송</category>
			<category>소프트웨어</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/51</guid>
			<comments>http://agile2robust.com/tc/51#entry51comment</comments>
			<pubDate>Sat, 25 Oct 2008 10:48:42 +0900</pubDate>
		</item>
		<item>
			<title>Open access 저널 - 그 변화에 대해</title>
			<link>http://agile2robust.com/tc/50</link>
			<description>&lt;p&gt;저널에 논문을 실었을 때, 그 논문의 저작권은 누가 가지는 것일까?&lt;/p&gt;

&lt;p&gt;저널 출판계에는 크게 두 가지의 방식이 있다. 하나는 &lt;a href=&quot;http://www.springer.com/&quot;&gt;Springer&lt;/a&gt;, &lt;a href=&quot;http://pubs.acs.org/&quot;&gt;ACS&lt;/a&gt;, &lt;a href=&quot;http://www.elsevier.com/wps/find/journal_browse.cws_home&quot;&gt;Elsevier&lt;/a&gt; 등의 전통적인 출판업자들이 지금까지 사용해온 모델로서, &lt;strong&gt;저자가 자신의 논문을 해당 저널에 싣기 위해서는 자신의 저작권을 출판사로 이전해 주는 권리 이전에 합의를 해야만 하는 상황&lt;/strong&gt;이다. 이런 상황에서 논문의 실제 저자는 논문에 대한 저작권 일체를 출판사에 주게 되기 때문에 자신의 홈페이지에 자신이 쓴 논문의 원문 파일을 올리는 것도 저작권 위반이 된다. 이런 상황을 피하기 위해서는 출판사에 저작권 이전을 하지 않으면 되는데, Springer 같은 경우에는 저작권을 출판사에 넘기지 않고 Open access로 공개하기 위해서는 논문 한 편당 $3,000, 그러니까 우리 돈으로 300만원 이상을 내야 한다.&lt;/p&gt;

&lt;p&gt;이에 반해서 Open access를 처음부터 채택하고 있는 저널 출판사들도 있는데, 바로 &lt;a href=&quot;http://www.biomedcentral.com/&quot;&gt;BioMed Central&lt;/a&gt;이 가장 대표적인 예라고 할 수 있다. 이런 저널에 논문을 싣게 되면 저자가 자신의 논문을 공개할 수 있게 되는데 보통은 &lt;a href=&quot;http://creativecommons.org/&quot;&gt;Creative Commons&lt;/a&gt;와 같은 라이센스 하에 논문을 출판하게 된다. 이런 저널들은 대부분 온라인으로만 출판이 되며, 모든 사람들이 비용 없이 논문에 접근할 수 있다.&lt;/p&gt;

&lt;p&gt;사실, 학문의 발전에 있어서 논문이 차지하고 있는 비중이 너무나 크기 때문에 필요한 논문에 접근하는데 있어서 많은 돈이 요구되는 지금과 같은 상황은 많은 사람들에게 비판을 받고 있는 상황이다. 최근에는 분자 모델링 분야의 논문들에 있어서도 이런 종류의 논의들이 많이 이루어지고 있다. 심지어는, 논문의 저자가 사용한 프로그램이 유료 프로그램, 혹은 구할 수 없는 프로그램인 경우에는 재현 불가능성 때문에 논문 심사를 제대로 할 수 없고 독자도 그 논문의 가치를 평가할 수 없는만큼, 연구를 위해 사용하는 프로그램은 모두 무료로 접근 가능한 것이어야 한다는 주장도 있다. 나 역시 이런 주장에 상당 부분 (전적으로는 아니지만) 동의하고 있다.&lt;/p&gt;

&lt;p&gt;최근에 &lt;a href=&quot;http://www.the-scientist.com/blog/display/55074/&quot;&gt;Springer가 BioMed Central을 인수했다는 뉴스&lt;/a&gt;가 있었다. 이 뉴스는 보통 사람들에게는 별 관심거리가 아닐 수 있지만, 논문을 많이 쓰고 저널에 투고하는 사람들에게는 꽤 흥미로운 뉴스가 아닐 수 없다. 왜냐하면, Springer가 BioMed Central을 별도의 독립 조직으로 두고 동일한 방식으로 계속 진행을 해 나가기로 했기 때문이다. 한 출판사에서 나오는 저널 중에 어떤 것은 Open access이고, 어떤 것은 Open access가 되기 위해 $3,000을 내야 하는 상황이 되기 때문이다. 미국의 NIH가 &#039;연방정부의 연구비 지원을 받아 출판되는 모든 논문은 PubMed Central에 공개해야 한다&#039;는 의무 조항 때문에 많은 논란이 있어 왔는데, 이번에 Springer의 BioMed Central 인수 뉴스는 이런 복잡한 흐름에 어떤 영향을 미칠지 매우 재미있게 지켜볼 수 밖에 없는 일이다.&lt;/p&gt;

&lt;p&gt;&lt;strong&gt;출판사의 이익을 보장함으로서 계속해서 저널 출판 사업을 할 수 있도록 하는 동력을 마련해 주는 것이 좋을지&lt;/strong&gt;, 아니면 &lt;strong&gt;연구 결과를 제한없이 공개함으로서 더욱 과학의 발전에 이바지할 수 있도록 하는 것이 좋을지&lt;/strong&gt;는 매우 미묘하고 어려운 문제가 아닐 수 없다.&lt;/p&gt;

&lt;p&gt;내 생각은 다음과 같다.&lt;/p&gt;

&lt;blockquote&gt;&lt;p&gt;음악의 포맷이 LP, Tape에서 CD로, 그리고 온라인으로 이동하면서 전에 볼 수 없었던 다양한 흐름이 생겨난 것과 마찬가지로, 저널 출판계에서도 이런 종류의 새로운 흐름이 생겨날 것 같다. 즉, 대부분의 저널들이 실제 프린트되어 나오는 하드 카피 인쇄를 포기하게 될 것이고 오직 온라인으로만 배포되는 비율이 높아질 것이다. 특히, 신속하게 오류를 수정하고 독자들간의 활발한 토론을 유발할 수 있는 시스템을 갖춘 논문들이 높은 인용지수를 받게 될 것이다. (너무 과격한 예측일지 몰라도 어쩌면 인용지수보다 구글랭크가 높은 논문을 좋은 논문으로 받아들이게 될지도 모른다.) 저널의 온라인 출판이 늘어날수록 저널 출판에 대한 진입 장벽은 낮아지게 되고, 저널 시장에서도 &lt;a href=&quot;http://ko.wikipedia.org/wiki/%EB%A1%B1%ED%85%8C%EC%9D%BC&quot;&gt;롱테일 효과&lt;/a&gt;라는 것이 나타나게 될 것이다. 원하는 논문 1편만을 다운로드 받는데 드는 비용이 지금과는 비교도 할 수 없을만큼 낮아질 것이고 (지금은 보통 한 편에 $50 정도) 이런 논문들을 모아서 서비스하는 저널계의 iTunes store 같은 존재가 나타나지 않는다고 누가 보장할 수 있을까!&lt;/p&gt;&lt;/blockquote&gt;&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>기타</category>
			<category>BioMed Central</category>
			<category>open access</category>
			<category>Springer</category>
			<category>과학</category>
			<category>논문</category>
			<category>롱테일</category>
			<category>저널</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/50</guid>
			<comments>http://agile2robust.com/tc/50#entry50comment</comments>
			<pubDate>Tue, 14 Oct 2008 17:47:32 +0900</pubDate>
		</item>
		<item>
			<title>새로운 CJD 출현에 대한 두려움</title>
			<link>http://agile2robust.com/tc/49</link>
			<description>&lt;h4&gt;들어가는 말&lt;br&gt;&lt;/h4&gt;

&lt;p&gt;이 글은 &lt;a href=&quot;http://www.telegraph.co.uk&quot;  target=&quot;_blank&quot;&gt;영국의 텔레그래프지&lt;/a&gt;에 Roger Highfield가 쓴 “&lt;a href=&quot;http://www.telegraph.co.uk/earth/main.jhtml?view=DETAILS&amp;amp;grid=&amp;amp;xml=/earth/2008/09/05/scicjd105.xml&quot;  target=&quot;_blank&quot;&gt;Fears of the new kinds of CJD&lt;/a&gt;”라는 기사와, 이 기사에서 언급하고 있는 &lt;a href=&quot;http://www.utmb.edu/neuro/faculty_profiles/ClaudioSoto.htm&quot;  target=&quot;_blank&quot;&gt;Claudio Soto&lt;/a&gt; 교수의 Cell지에 실린 논문 “&lt;a href=&quot;http://www.cell.com/retrieve/pii/S0092867408009501&quot;  target=&quot;_blank&quot;&gt;Crossing the species barrier by PrPSc replication in vitro generates unique infectious prions&lt;/a&gt;”을 읽고 그 내용을 기반으로 쓴 글입니다. 좀더 정확하고 자세한 내용을 원하시는 분들은 원 글을 읽어보시기 바랍니다.&lt;/p&gt;

&lt;h4&gt;배경설명&lt;/h4&gt;

&lt;p&gt;&lt;a href=&quot;http://en.wikipedia.org/wiki/Creutzfeldt-Jakob_disease&quot;  target=&quot;_blank&quot;&gt;CJD&lt;/a&gt;(크로이츠펠트-야콥병)는 잘 알려진(!) 것처럼 소의 광우병과 유사한 증세를 보이는 사람의 병을 일컫는 말이다. 지난 몇 달간 한국을 뜨겁게 달궜던 소고기 논란과 관련해서, 광우병에 감염된 소고기를 통해 감염된 경우에는 vCJD라고 하고 감염이 아닌 산발성으로 일어난 경우에는 sCJD(sporadic CJD)라고 부른다. 소의 경우 광우병의 정확한 병명은 &lt;a href=&quot;http://en.wikipedia.org/wiki/Bovine_spongiform_encephalopathy&quot;  target=&quot;_blank&quot;&gt;BSE&lt;/a&gt;(Bovine spongiform Encephalopathy)이다. 이 병은 양, 엘크 등 다른 동물에서도 나타나는 것으로 알려져 있다. 이 병은 프리온이라는 단백질이 이상접힘 현상을 통해 변성프리온으로 전환되고, 전환된 변성프리온이 정상프리온 단백질을 변성시킴으로서 증폭되어 섬유를 형성하고, 이것이 조직에 쌓여 조직을 손상시키게 된다.&lt;/p&gt;

&lt;p&gt;단백질의 이상접힘 현상은 치매를 일으키는 아밀로이드 베타 단백질에서도 볼 수 있는 현상이며, 치매 역시 아밀로이드 베타의 이상접힘으로 인해 단백질이 응집되어 플라크를 형성하고, 이 중간 단계에서 뇌세포에 독성을 나타내서 뇌세포를 죽게 만드는 것으로 알려져 있다.&lt;/p&gt;

&lt;h4&gt;새로운 CJD?&lt;br&gt;&lt;/h4&gt;

&lt;p&gt;미국의 &lt;a href=&quot;http://www.utmb.edu/neuro/faculty_profiles/ClaudioSoto.htm&quot;  target=&quot;_blank&quot;&gt;Claudio Soto&lt;/a&gt; 교수는 &lt;a href=&quot;http://en.wikipedia.org/wiki/PMCA&quot;  target=&quot;_blank&quot;&gt;PMCA&lt;/a&gt;(Protein misfolding cyclic amplification)라는 방법을 통해 시료 내에 아주 적은 양으로 존재하는 변성프리온 단백질을 검출하는 방법을 개발한 학자이다. 이 방법은 쉽게 말해서, 정상프리온은 여러 개가 뭉치지 않는 반면 변성프리온은 정상프리온의 구조를 변형시킨 후에 여러 개가 뭉쳐서 커지는 성질이 있으므로, 생성된 단백질 덩어리를 계속해서 기계적인 충격을 통해 깨 주게 되면 새롭게 덩어리가 자라는 현상을 이용하여 변성프리온을 증폭하는 방법이다.&lt;/p&gt;

&lt;p&gt;Soto 교수의 이번 논문의 내용을 정리하면 다음과 같다.&lt;/p&gt;

&lt;p&gt;마우스의 변성프리온 단백질과 햄스터의 정상프리온을 섞은 후 PMCA로 증폭을 해 보았더니, 햄스터에게 영향을 미치는 새로운 종류의 변성프리온이 생성되었으며, 반대의 경우(마우스의 정상프리온과 햄스터의 변성프리온을 섞은 경우)에도 동일한 결과(마우스에 영향을 미치는 새로운 종류의 변성프리온 생성)가 나타났다는 것이다. (물론 이런 내용 외에도 중요한 다른 포인트들도 많이 있지만 이 글에서는 언급하지 않기로 한다)&lt;/p&gt;

&lt;p&gt;이 사실은 매우 중요한 의미를 지니고 있다. 일반적으로 프리온 질환의 경우 종간에는 어떤 장벽이 있는 것으로 생각되어 왔다. 이 장벽 때문에 다른 종 간에는 프리온질환이 잘 전염되지 않는다는 것이다. 물론 광우병이 사람에 전염되는 것과 같은 경우가 없는 것은 아니지만, 소를 제외한 양이나 엘크 등으로부터는 전염되지 않는 것으로 생각해 온 것이 사실이다. 그러나, 이 실험의 결과에 의하면 &lt;strong&gt;서로 다른 종의 프리온 단백질이 전혀 새로운 변성프리온을 생성시킬 수 있었고&lt;/strong&gt;, 이 사실은 소를 제외한 다른 동물의 변성프리온에 의해 인간이 감염될 가능성이 있다는 사실을 암시하고 있는 것이다.&lt;/p&gt;

&lt;p&gt;변성프리온이 정상프리온과 다른 점이 단지 구조적인 변화 뿐이라는 사실, 그리고 프리온의 감염은 유전자에 의해 매개되는 것이 아니라 단백질 그 자체에 의해 매개된다는 사실을 연관지어 생각해 보면, 서로 다른 감염 능력을 보이는 변성프리온이 여러 종류 존재한다는 것은, &lt;strong&gt;새로운 구조를 가진 변성프리온이 출현하여 사람에게 감염될 가능성이 있다&lt;/strong&gt;는 사실을 예측할 수 있다.&lt;/p&gt;

&lt;p&gt;미래에 지금까지 알려진 것과 다른 양상을 보이는 변성프리온이 돼지를 감염시킬 수도 있지 않을까? 혹은 전염성이 지금보다 훨씬 강한 새로운 변성프리온이 나타나지 않을까? 이런 질문들을 던졌을 때 자신있게 &quot;NO”라고 대답할 수 없다는 사실은 보건 측면에서 매우 두려운 일이 아닐 수 없다.&lt;/p&gt;

&lt;h4&gt;그래서...&lt;/h4&gt;

&lt;p&gt;단백질 접힘이라는 주제는 매우 기초적인 주제이다. 많은 과학자들이 단백질 접힘이라는 현상을 이해하기 위해 많은 노력을 하고 있지만, 존재하는 구조에 대한 정보를 기반으로 하지 않고 처음부터 수학적으로 현상을 풀어내려는 노력은 아직도 갈 길이 먼 상황이다. 이런 단백질 접힘 연구와 광우병이라는 현상은 매우 큰 간격이 있는 것 같아 보이지만, 앞의 기초가 해결되지 않은 상황에서는 뒤의 문제를 해결하는 것이 매우 어렵다고 할 수 있다.&lt;/p&gt;

&lt;p&gt;만약 단백질 접힘 현상을 이해하고 이 현상을 시뮬레이션할 수 있는 학문적인 기초가 마련된다면, 그것을 막거나 변화시킬 수 있는 방법을 찾는데 큰 도움이 될 것이다. 그러나, 그런 기초가 없는 상태에서는 막연하게 trial-and-error 방법으로 해결책을 찾을 수 밖에 없는 것이다.&lt;/p&gt;

&lt;p&gt;광우병과 관련된 문제를 해결하는 것이 의사나 약사의 문제, 혹은 사회적인 문제일 수도 있다. 그러나, &lt;strong&gt;과학적인 부분, 그 중에서도 가장 기초적인 부분에 대한 지속적인 연구가 없다면 이 문제를 제대로 해결하는 것은 요원한 일이 될 것이다&lt;/strong&gt;.&lt;/p&gt;&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>과학 일반</category>
			<category>CJD</category>
			<category>광우병</category>
			<category>기초과학</category>
			<category>단백질</category>
			<category>시뮬레이션</category>
			<category>이상접힘</category>
			<category>전염</category>
			<category>프리온</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/49</guid>
			<comments>http://agile2robust.com/tc/49#entry49comment</comments>
			<pubDate>Fri, 12 Sep 2008 18:00:00 +0900</pubDate>
		</item>
		<item>
			<title>정보학: 오래된 약의 새로운 쓰임새</title>
			<link>http://agile2robust.com/tc/48</link>
			<description>&lt;p&gt;약의 부작용은 원래 디자인했던 타겟 단백질이 아닌 다른 단백질, 즉 off-target 단백질에 결합하기 때문에 나타날 수 있다. 보통 약의 부작용은 원하지 않는 것으로서 좋지 않은 것으로 생각할 수 있지만, 어떤 경우에는 이런 부작용이 좋은 결과를 가지고 올 수도 있다. 약의 부작용을 통해서 약의 새로운 사용처를 발견하게 될 수 있기 때문이다. 부작용을 통해 약의 새로운 사용처를 발견한 가장 좋은 예는 Viagra일 것이다. 고혈압과 협심증 치료제 개발 과정에서 만들어진 &lt;a href=&quot;http://en.wikipedia.org/wiki/Viagra&quot;&gt;viagra&lt;/a&gt;(화합물명 &lt;a href=&quot;http://pubchem.ncbi.nlm.nih.gov/summary/summary.cgi?cid=5281023&quot;&gt;Sildenafil&lt;/a&gt;)는 임상에서 협심증에는 효과가 별로 없지만 발기 부전에 효과가 있음이 발견되었고, 1998년에 미국의 FDA에서 허가를 받음으로서 경제적으로는 물론이고 사회적으로도 엄청난 반향을 불러온 블록버스터 신약이 되었다.&lt;/p&gt;

&lt;p&gt;이외에도 부작용에 대한 정보를 통해 적응증을 변경하여 성공한 신약 개발 사례는 여러 가지가 있으며, 최근에는 신약 개발의 패러다임 자체가 &lt;strong&gt;한 개의 주요 타겟 단백질에 대해 높은 약효를 갖는 화합물을 찾는 방식&lt;/strong&gt;에서 &lt;strong&gt;복용시 독성이 없는 화합물의 적응증을 찾는 방식&lt;/strong&gt;으로 바뀌어가고 있을 정도이다. 후자의 방법을 사용하기 위해서, 신약 개발의 가장 초기 단계에 합성되는 화합물들에 대해서도 약효, 부작용, 독성 등과 관련된 다양한 단백질 타겟에 대한 실험을 대량(보통 수십개)으로 모아서 진행하는 panel assay가 이루어지고 있고, 이에 따라 수많은 화합물들의 assay 데이터가 생산되고 있다. 데이터의 증가는 분석의 필요성을 증대시키므로 필연적으로 정보학의 발전을 가져오고, 이를 통해 현상에 대한 새로운 이해가 가능해지게 된다. 약의 부작용에 대한 관심이 높아지고, 이에 대한 데이터 역시 증가하면서, 약의 부작용에 대한 정보학적인 연구들이 이루어지고 있으며, 미국의 저명한 과학잡지인 &lt;a href=&quot;http://dx.doi.org/10.1126/science.1158140&quot;&gt;Science에 실린 이 기사&lt;/a&gt;는 이런 연구 중에서도 가장 최신의 결과를 잘 보여주고 있다.&lt;/p&gt;

&lt;p&gt;우선 데이터를 광범위하게 수집하고 이를 정확하게 분류하는 작업이 필요하다. 저자들은 약의 포장에 들어있는 정보로부터 약의 부작용과 관련된 정보들을 모으고, 이 정보들을 &lt;a href=&quot;http://www.nlm.nih.gov/research/umls/&quot;&gt;Unified Medical Language System&lt;/a&gt;에 맞춰서 정리하였다. (실제로 데이터의 수집도 매우 손이 많이 가고 시간을 많이 소요하는 작업이지만, 이런 식의 데이터 정리와 분류는 그보다도 몇 배 힘들고 지루한 작업 중의 하나이다. 이런 작업을 자동으로 할 수 있다면 좋겠지만, 그렇게 하더라도 결국은 연구자의 눈으로 확인하지 않을 수 없기 때문에 더욱 어려운 일이라고 할 수 있다) 그리고 모든 부작용이 동일한 빈도로 나타나는 것이 아니기 때문에, 빈도에 따라 각각의 부작용에 가중치를 부여했다.&lt;/p&gt;

&lt;p&gt;이 가중치를 이용하여 통계적인 의미가 있는지를 분석하면 부작용 유사도(side effect similarity)를 계산할 수 있다. (여기서 유사도는 생물학적 유사도에서 원래 목표로 하고 있는 약효를 제외한 것이라고 볼 수 있다.) 이 부작용 유사도를 타겟 단백질이 알려진 약에 대해 계산하여 유사도와 실제 부작용의 상관관계를 분석했더니 두 수치 사이에 분명한 관계가 있음을 알 수 있었다.&lt;/p&gt;

&lt;p&gt;이제 타겟이 알려지지 않은 약을 포함한 데이터에 대해 이 방법을 적용하고 25% 이상의 확률로 타겟을 공유할 것으로 생각되는 약의 짝을 네트워크로 분석하였다. 이 중에서 화합물의 구조가 매우 다르고 적응증도 다른 것들을 추린 후에 일부에 대하여 실제 &lt;em&gt;in vitro&lt;/em&gt; 실험을 진행하였다. 20쌍에 대해 실험을 진행한 결과 이 중 13쌍에서 예측된 타겟 단백질에 대한 결합이 이루어지고 있음을 알 수 있었고, 이 중에서 11개는 부작용을 일으킬만큼 강력한 결합을 보인다는 사실을 알 수 있었다.&lt;/p&gt;

&lt;p&gt;이 논문에서 수행한 방법을 판매되는 약, 혹은 개발 중에 있는 약에 적용할 경우, 약의 적응증을 새롭게 개발하는 &lt;strong&gt;Drug Repositioning&lt;/strong&gt;에 효과적으로 적용할 수 있을 것으로 생각된다. &lt;strong&gt;특정 단백질을 저해하는 리간드군 간의 유사도 분석&lt;/strong&gt;, &lt;strong&gt;단백질의 결합 부위만의 유사도 분석&lt;/strong&gt;과 같은 방법이 이미 알려져 있으며, 이 논문에서 제시한 &lt;strong&gt;알려진 &lt;em&gt;in vivo&lt;/em&gt; 부작용 간의 유사도 분석&lt;/strong&gt;도 또다른 중요한 연구 방법이 될 것으로 생각된다. 그리고 이런 분석법 간의 연관 관계를 메타 분석함으로서 리간드 구조 유사도, 단백질 구조 유사도, 부작용 유사도 등이 서로 어떻게 연관되어 있는지, 어떤 요소들이 이런 연관과 관련이 있으며, ,어떤 요소들은 이런 연관 관계를 약화시키는지에 대한 이해를 얻을 수도 있을 것으로 생각된다.&lt;/p&gt;

&lt;fieldset style=&quot;margin:20px 0px 20px 0px;padding:5px;&quot;&gt;&lt;legend&gt;&lt;span&gt;&lt;strong&gt;크리에이티브 커먼즈 라이센스&lt;/strong&gt;&lt;/span&gt;&lt;/legend&gt;&lt;!--Creative Commons License--&gt;&lt;div style=&quot;float: left; width: 88px; margin-top: 3px;&quot;&gt;&lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;&lt;img alt=&quot;Creative Commons License&quot; style=&quot;border-width: 0&quot; src=&quot;http://i.creativecommons.org/l/by-nc-nd/2.0/kr/88x31.png&quot;/&gt;&lt;/a&gt;&lt;/div&gt;&lt;div style=&quot;margin-left: 92px; margin-top: 3px; text-align: justify;&quot;&gt;이 저작물은 &lt;a rel=&quot;license&quot; href=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; target=_blank&gt;크리에이티브 커먼즈 코리아 저작자표시-비영리-변경금지 2.0 대한민국 라이센스&lt;/a&gt;에 따라 이용하실 수 있습니다.
			&lt;!-- Creative Commons License--&gt;
			&lt;!-- &lt;rdf:RDF xmlns=&quot;http://web.resource.org/cc/&quot; xmlns:dc=&quot;http://purl.org/dc/elements/1.1/&quot; xmlns:rdf=&quot;http://www.w3.org/1999/02/22-rdf-syntax-ns#&quot;&gt;
			&lt;Work rdf:about=&quot;&quot;&gt;
			&lt;license rdf:resource=&quot;http://creativecommons.org/licenses/by-nc-nd/2.0/kr/&quot; /&gt;
			&lt;/Work&gt;
			&lt;License rdf:about=&quot;http://creativecommons.org/licenses/by-nc-nd/&quot;&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Reproduction&quot;/&gt;
			&lt;permits rdf:resource=&quot;http://web.resource.org/cc/Distribution&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Notice&quot;/&gt;
			&lt;requires rdf:resource=&quot;http://web.resource.org/cc/Attribution&quot;/&gt;&lt;prohibits rdf:resource=&quot;http://web.resource.org/cc/CommercialUse&quot;/&gt;&lt;/License&gt;&lt;/rdf:RDF&gt; --&gt;&lt;/div&gt;&lt;/fieldset&gt;</description>
			<category>신약개발</category>
			<category>부작용</category>
			<category>신약개발</category>
			<category>유사도</category>
			<category>정보학</category>
			<category>화학정보학</category>
			<author>(lordmiss)</author>
			<guid>http://agile2robust.com/tc/48</guid>
			<comments>http://agile2robust.com/tc/48#entry48comment</comments>
			<pubDate>Thu, 04 Sep 2008 13:17:26 +0900</pubDate>
		</item>
	</channel>
</rss>
