-
Notifications
You must be signed in to change notification settings - Fork 0
/
Copy path2017-03-02-new-generation-web-archive.html
203 lines (171 loc) · 12.6 KB
/
2017-03-02-new-generation-web-archive.html
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
65
66
67
68
69
70
71
72
73
74
75
76
77
78
79
80
81
82
83
84
85
86
87
88
89
90
91
92
93
94
95
96
97
98
99
100
101
102
103
104
105
106
107
108
109
110
111
112
113
114
115
116
117
118
119
120
121
122
123
124
125
126
127
128
129
130
131
132
133
134
135
136
137
138
139
140
141
142
143
144
145
146
147
148
149
150
151
152
153
154
155
156
157
158
159
160
161
162
163
164
165
166
167
168
169
170
171
172
173
174
175
176
177
178
179
180
181
182
183
184
185
186
187
188
189
190
191
192
193
194
195
196
197
198
199
200
201
202
203
<!DOCTYPE html>
<html lang="ja" prefix="og: http://ogp.me/ns# fb: https://www.facebook.com/2008/fbml">
<head>
<title>次世代Webアーカイブを作成しました - Debate Information Laboratory</title>
<!-- Using the latest rendering mode for IE -->
<meta http-equiv="X-UA-Compatible" content="IE=edge">
<meta charset="utf-8">
<meta name="viewport" content="width=device-width, initial-scale=1.0">
<link rel="canonical" href="https://debate.info-labs.jp/2017-03-02-new-generation-web-archive.html">
<meta name="author" content="mugwort_rc" />
<meta name="description" content="次世代WebアーカイブはWebページのクロール結果にデジタル署名を施すことで、サービス外にデータを移したとしても有効な証拠であり続ける新しいWebアーカイブサービスです。 従来のWebアーカイブサービスは収集結果をWebサービス上で提供することで証拠としての機能を提供してきました。 しかし、Webサービスが終了してしまえば、それらの証拠は失われることになります。 仮にユーザーがアーカイブを手元で保管しようとしても、ユーザーの手元に渡った時点で改ざんの疑いが生じるため証拠の効力が失われてしまいます。 このサービスではリクエストされたURLの記録と同時にデジタル署名を付加することで、サーバーで作成された時点から改ざんが行われていないことを保証し、ユーザーの手元でも証拠の効力を維持できるようにしました。 アーカイブ手法はInternet Archive (archive.org)で実際に使用されているWARCファイルフォーマット(ISO 28500:2009)に準拠しています。 デジタル署名はOpenPGP(RFC 4880)の実装の一つ、GnuPGを用いて作成しています。 署名鍵は Info Labs Archive (2017 4096 bits) (keyid=728AA3B54479F3F4) になります。 デジタル署名用の検証ツールも用意しました。 アーカイブはhttps://github.com/ikreymer/pywbなどを用いて閲覧することが出来ます。 GUIのアーカイブビューアについては現在鋭意製作中です。 参照 次世代Webアーカイブ QGPG" />
<meta property="og:site_name" content="Debate Information Laboratory" />
<meta property="og:type" content="article"/>
<meta property="og:title" content="次世代Webアーカイブを作成しました"/>
<meta property="og:url" content="https://debate.info-labs.jp/2017-03-02-new-generation-web-archive.html"/>
<meta property="og:description" content="次世代WebアーカイブはWebページのクロール結果にデジタル署名を施すことで、サービス外にデータを移したとしても有効な証拠であり続ける新しいWebアーカイブサービスです。 従来のWebアーカイブサービスは収集結果をWebサービス上で提供することで証拠としての機能を提供してきました。 しかし、Webサービスが終了してしまえば、それらの証拠は失われることになります。 仮にユーザーがアーカイブを手元で保管しようとしても、ユーザーの手元に渡った時点で改ざんの疑いが生じるため証拠の効力が失われてしまいます。 このサービスではリクエストされたURLの記録と同時にデジタル署名を付加することで、サーバーで作成された時点から改ざんが行われていないことを保証し、ユーザーの手元でも証拠の効力を維持できるようにしました。 アーカイブ手法はInternet Archive (archive.org)で実際に使用されているWARCファイルフォーマット(ISO 28500:2009)に準拠しています。 デジタル署名はOpenPGP(RFC 4880)の実装の一つ、GnuPGを用いて作成しています。 署名鍵は Info Labs Archive (2017 4096 bits) (keyid=728AA3B54479F3F4) になります。 デジタル署名用の検証ツールも用意しました。 アーカイブはhttps://github.com/ikreymer/pywbなどを用いて閲覧することが出来ます。 GUIのアーカイブビューアについては現在鋭意製作中です。 参照 次世代Webアーカイブ QGPG"/>
<meta property="article:published_time" content="2017-03-02" />
<meta property="article:section" content="info" />
<meta property="article:author" content="mugwort_rc" />
<!-- Bootstrap -->
<link rel="stylesheet" href="https://debate.info-labs.jp/theme/css/bootstrap.min.css" type="text/css"/>
<link href="https://debate.info-labs.jp/theme/css/font-awesome.min.css" rel="stylesheet">
<link href="https://debate.info-labs.jp/theme/css/pygments/native.css" rel="stylesheet">
<link rel="stylesheet" href="https://debate.info-labs.jp/theme/css/style.css" type="text/css"/>
<link href="https://debate.info-labs.jp/feeds/all.atom.xml" type="application/atom+xml" rel="alternate"
title="Debate Information Laboratory ATOM Feed"/>
<link href="https://debate.info-labs.jp/feeds/info.atom.xml" type="application/atom+xml" rel="alternate"
title="Debate Information Laboratory info ATOM Feed"/>
<script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
<script>
(adsbygoogle = window.adsbygoogle || []).push({
google_ad_client: "ca-pub-9939783692930196",
enable_page_level_ads: true
});
</script>
</head>
<body>
<div class="navbar navbar-default navbar-fixed-top" role="navigation">
<div class="container">
<div class="navbar-header">
<button type="button" class="navbar-toggle" data-toggle="collapse" data-target=".navbar-ex1-collapse">
<span class="sr-only">Toggle navigation</span>
<span class="icon-bar"></span>
<span class="icon-bar"></span>
<span class="icon-bar"></span>
</button>
<a href="https://debate.info-labs.jp/" class="navbar-brand">
Debate Information Laboratory </a>
</div>
<div class="collapse navbar-collapse navbar-ex1-collapse">
<ul class="nav navbar-nav">
<li class="active">
<a href="https://debate.info-labs.jp/category/info.html">Info</a>
</li>
</ul>
<ul class="nav navbar-nav navbar-right">
<li><a href="https://debate.info-labs.jp/archives.html"><i class="fa fa-th-list"></i><span class="icon-label">Archives</span></a></li>
</ul>
</div>
<!-- /.navbar-collapse -->
</div>
</div> <!-- /.navbar -->
<!-- Banner -->
<!-- End Banner -->
<div class="container">
<div class="row">
<div class="col-sm-9">
<section id="content">
<article>
<header class="page-header">
<h1>
<a href="https://debate.info-labs.jp/2017-03-02-new-generation-web-archive.html"
rel="bookmark"
title="Permalink to 次世代Webアーカイブを作成しました">
次世代Webアーカイブを作成しました
</a>
</h1>
</header>
<div class="entry-content">
<div class="panel">
<div class="panel-body">
<footer class="post-info">
<span class="label label-default">Date</span>
<span class="published">
<i class="fa fa-calendar"></i><time datetime="2017-03-02T00:00:00+09:00"> 木 02 3月 2017</time>
</span>
</footer><!-- /.post-info --> </div>
</div>
<p><a href="https://info-labs.jp/crawler/">次世代Webアーカイブ</a>はWebページのクロール結果にデジタル署名を施すことで、サービス外にデータを移したとしても有効な証拠であり続ける新しいWebアーカイブサービスです。</p>
<p>従来のWebアーカイブサービスは収集結果をWebサービス上で提供することで証拠としての機能を提供してきました。</p>
<p>しかし、Webサービスが終了してしまえば、それらの証拠は失われることになります。</p>
<p>仮にユーザーがアーカイブを手元で保管しようとしても、ユーザーの手元に渡った時点で改ざんの疑いが生じるため証拠の効力が失われてしまいます。</p>
<p>このサービスではリクエストされたURLの記録と同時にデジタル署名を付加することで、サーバーで作成された時点から改ざんが行われていないことを保証し、ユーザーの手元でも証拠の効力を維持できるようにしました。</p>
<p>アーカイブ手法はInternet Archive (archive.org)で実際に使用されているWARCファイルフォーマット(ISO 28500:2009)に準拠しています。</p>
<p>デジタル署名はOpenPGP(RFC 4880)の実装の一つ、GnuPGを用いて作成しています。</p>
<p>署名鍵は <a href="https://info-labs.jp/pks/lookup?op=vindex&search=0x728aa3b54479f3f4">Info Labs Archive (2017 4096 bits)</a> (keyid=728AA3B54479F3F4) になります。</p>
<p>デジタル署名用の<a href="https://github.com/info-labs/QGPG/releases/tag/v0.1.0">検証ツール</a>も用意しました。</p>
<p>アーカイブは<a href="https://github.com/ikreymer/pywb">https://github.com/ikreymer/pywb</a>などを用いて閲覧することが出来ます。</p>
<p>GUIのアーカイブビューアについては現在鋭意製作中です。</p>
<h2>参照</h2>
<ul>
<li><a href="https://info-labs.jp/crawler/">次世代Webアーカイブ</a></li>
<li><a href="https://github.com/info-labs/QGPG">QGPG</a></li>
</ul>
</div>
<!-- /.entry-content -->
</article>
</section>
</div>
<div class="col-sm-3" id="sidebar">
<aside>
<section class="well well-sm">
<ul class="list-group list-group-flush">
<li class="list-group-item"><h4><i class="fa fa-home fa-lg"></i><span class="icon-label">Social</span></h4>
<ul class="list-group" id="social">
<li class="list-group-item"><a href="https://github.com/info-labs"><i class="fa fa-github-square fa-lg"></i> GitHub</a></li>
<li class="list-group-item"><a href="https://twitter.com/InfoLabs_jp"><i class="fa fa-twitter-square fa-lg"></i> Twitter</a></li>
</ul>
</li>
</ul>
</section>
</aside>
</div>
<div class="col-sm-3">
<script async src="//pagead2.googlesyndication.com/pagead/js/adsbygoogle.js"></script>
<!-- debate.info-labs.jp -->
<ins class="adsbygoogle"
style="display:block"
data-ad-client="ca-pub-9939783692930196"
data-ad-slot="6351460060"
data-ad-format="auto"></ins>
<script>
(adsbygoogle = window.adsbygoogle || []).push({});
</script>
</div>
</div>
</div>
<footer>
<div class="container">
<hr>
<div class="row">
<div class="col-xs-10">© 2017 mugwort_rc
· Powered by <a href="https://github.com/getpelican/pelican-themes/tree/master/pelican-bootstrap3" target="_blank">pelican-bootstrap3</a>,
<a href="http://docs.getpelican.com/" target="_blank">Pelican</a>,
<a href="http://getbootstrap.com" target="_blank">Bootstrap</a> </div>
<div class="col-xs-2"><p class="pull-right"><i class="fa fa-arrow-up"></i> <a href="#">Back to top</a></p></div>
</div>
</div>
</footer>
<script src="https://debate.info-labs.jp/theme/js/jquery.min.js"></script>
<!-- Include all compiled plugins (below), or include individual files as needed -->
<script src="https://debate.info-labs.jp/theme/js/bootstrap.min.js"></script>
<!-- Enable responsive features in IE8 with Respond.js (https://github.com/scottjehl/Respond) -->
<script src="https://debate.info-labs.jp/theme/js/respond.min.js"></script>
<!-- Google Analytics -->
<script type="text/javascript">
var _gaq = _gaq || [];
_gaq.push(['_setAccount', 'UA-46162887-3']);
_gaq.push(['_trackPageview']);
(function () {
var ga = document.createElement('script');
ga.type = 'text/javascript';
ga.async = true;
ga.src = ('https:' == document.location.protocol ? 'https://ssl' : 'http://www') + '.google-analytics.com/ga.js';
var s = document.getElementsByTagName('script')[0];
s.parentNode.insertBefore(ga, s);
})();
</script>
<!-- End Google Analytics Code -->
</body>
</html>