Download as pdf or txt
Download as pdf or txt
You are on page 1of 41

Big Data Analytics in the Social and

Ubiquitous Context 5th International


Workshop on Modeling Social Media
MSM 2014 5th International Workshop
on Mining Ubiquitous and Social
Environments MUSE 2014 and First
International Workshop on Machine
Learnin 1st Edition Martin Atzmueller
Visit to download the full and correct content document:
https://textbookfull.com/product/big-data-analytics-in-the-social-and-ubiquitous-contex
t-5th-international-workshop-on-modeling-social-media-msm-2014-5th-international-w
orkshop-on-mining-ubiquitous-and-social-environments-muse-2014-a/
Martin Atzmueller · Alvin Chin
Frederik Janssen · Immanuel Schweizer
Christoph Trattner (Eds.)

Big Data Analytics


LNAI 9546

in the Social and


Ubiquitous Context
5th International Workshop on Modeling Social Media, MSM 2014
5th International Workshop on Mining Ubiquitous
and Social Environments, MUSE 2014
and First International Workshop on Machine Learning
for Urban Sensor Data, SenseML 2014, Revised Selected Papers

123
Lecture Notes in Artificial Intelligence 9546

Subseries of Lecture Notes in Computer Science

LNAI Series Editors


Randy Goebel
University of Alberta, Edmonton, Canada
Yuzuru Tanaka
Hokkaido University, Sapporo, Japan
Wolfgang Wahlster
DFKI and Saarland University, Saarbrücken, Germany

LNAI Founding Series Editor


Joerg Siekmann
DFKI and Saarland University, Saarbrücken, Germany
More information about this series at http://www.springer.com/series/1244
Martin Atzmueller Alvin Chin •

Frederik Janssen Immanuel Schweizer


Christoph Trattner (Eds.)

Big Data Analytics


in the Social and
Ubiquitous Context
5th International Workshop on Modeling Social Media, MSM 2014
5th International Workshop on Mining Ubiquitous and Social Environments, MUSE 2014
and First International Workshop on Machine Learning for Urban Sensor Data, SenseML 2014
Revised Selected Papers

123
Editors
Martin Atzmueller Immanuel Schweizer
University of Kassel TU Darmstadt
Kassel, Hessen Darmstadt
Germany Germany
Alvin Chin Christoph Trattner
BMW Technology Group Graz University of Technology
Chicago, IL Graz
USA Austria
Frederik Janssen
Knowledge Engineering
Technische Universität Darmstadt
Darmstadt, Hessen
Germany

ISSN 0302-9743 ISSN 1611-3349 (electronic)


Lecture Notes in Artificial Intelligence
ISBN 978-3-319-29008-9 ISBN 978-3-319-29009-6 (eBook)
DOI 10.1007/978-3-319-29009-6

Library of Congress Control Number: 2015960407

LNCS Sublibrary: SL7 – Artificial Intelligence

© Springer International Publishing Switzerland 2016


This work is subject to copyright. All rights are reserved by the Publisher, whether the whole or part of the
material is concerned, specifically the rights of translation, reprinting, reuse of illustrations, recitation,
broadcasting, reproduction on microfilms or in any other physical way, and transmission or information
storage and retrieval, electronic adaptation, computer software, or by similar or dissimilar methodology now
known or hereafter developed.
The use of general descriptive names, registered names, trademarks, service marks, etc. in this publication
does not imply, even in the absence of a specific statement, that such names are exempt from the relevant
protective laws and regulations and therefore free for general use.
The publisher, the authors and the editors are safe to assume that the advice and information in this book are
believed to be true and accurate at the date of publication. Neither the publisher nor the authors or the editors
give a warranty, express or implied, with respect to the material contained herein or for any errors or
omissions that may have been made.

Printed on acid-free paper

This Springer imprint is published by SpringerNature


The registered company is Springer International Publishing AG Switzerland
Preface

Ubiquitous and social computing are creating new environments that foster the social
interaction of users in several contexts. Concerning social environments, e.g., social
media and the social web, there are a variety of social networking environments being
implemented in an increasing number of social media applications. For the ubiquitous
ones, there are accordingly different small distributed devices and sensors. Overall,
ubiquitous and social environments are transcending many diverse domains and con-
texts, including events and activities in business and personal life, generating massive
amounts of data that then require appropriate analysis approaches, methods, and
techniques from the area of big data analytics.
This book sets out to explore this area by presenting a number of current approaches
and studies addressing selected aspects of this issue. The individual contributions of
this book focus on problems related to Big Data analytics in social and ubiquitous
contexts, i.e., integrating both ubiquitous data and social media. Methods for the
analysis of Big Data in social and ubiquitous contexts concerning both advanced
algorithmic solutions as well as analysis techniques focusing on complex data char-
acteristics can then help to advance our understanding of the dynamics and structures
inherent to the respective environments.
In these contexts, we present work that tackles issues such as natural language
processing in social media, collective intelligence, analysis of social and mobility
patterns, and anomaly detection in social and ubiquitous data.
The papers presented in this book are revised and significantly extended versions of
papers submitted to three related workshops: The 5th International Workshop on
Mining Ubiquitous and Social Environments (MUSE 2014), which was held on
September 15, 2014, in conjunction with the European Conference on Machine
Learning and Principles and Practice of Knowledge Discovery in Databases
(ECML-PKDD 2014) in Nancy, France, the 5th International Workshop on Modeling
Social Media (MSM 2014) that was held on April 8, 2014, in conjunction with
ACM WWW in Seoul, Korea, and the First International Workshop on Machine
Learning for Urban Sensor Data (SenseML 2014). With respect to these three com-
plementing workshop themes, the papers contained in this volume form a starting point
for bridging the gap between the social and ubiquitous worlds. Concerning the range of
topics, we broadly distinguish between social context, ubiquitous context, and works
bridging both.
For the first main theme, we included three works focusing on aspects regarding the
social context. We present “Using Wikipedia for Cross-Language Named Entity
Recognition” by Eraldo Fernandes, Ulf Brefeld, Roi Blanco, and Jordi Atserias, pro-
viding an interesting method for named entity recognition and classification based on
exploiting the link structure of Wikipedia. In “On the Predictive Power of Web
Intelligence and Social Media” by Nathan Kallus, a novel predictive approach for Web
intelligence using Web and social media mining is presented. In another interesting
VI Preface

work, “A Latent Space Analysis of Editor Lifecycles in Wikipedia,” Xiangju Qin,


Derek Greene, and Padraig Cunningham show how topic analysis can be adapted for
analyzing editor behavior and for identifying different activity classes.
For the second main theme bridging the social and ubiquitous context, we included
two papers. The paper “On Spatial Measures of Geographic Relevance for Geotagged
Social Media Content” by Xin Wang, Tristan Gaugel, and Matthias Keller presents
spatial measures describing geospatial characteristics of social media content. In
“Formation and Temporal Evolution of Social Groups During Coffee Breaks” by
Martin Atzmueller, Andreas Ernst, Friedrich Krebs, Christoph Scholz, and Gerd
Stumme, the authors describe different group evolution events in social and ubiquitous
environments and present an analysis in the scope of academic conferences.
For the third main theme, we included four works targeting ubiquitous contexts. The
paper “A Habit Detection Algorithm (HDA) for Discovering Recurrent Patterns in
Smart Meter Time Series” by Rachel Cardell-Oliver presents an approach for detecting
habits in smart water meter time series. In “RoADS: A Road Pavement Monitoring
System for Anomaly Detection Using Smart Phones” by Fatjon Seraj, Berend Jan van
der Zwaag, Arta Dilo, Tamara Luarasi, and Paul Havinga, the authors present a method
for road pavement analysis resulting in a real-time multiclass road anomaly detector.
The paper “Mining Ticketing Logs for Usage Characterization with Nonnegative
Matrix Factorization” by Mickaël Poussevin, Nicolas Baskiotis, Vincent Guigue,
Patrick Gallinari, and Emeric Tonnelier sets out to analyze activity patterns in an urban
transportation network using nonnegative matrix factorization. Finally, in
“Context-Aware Location Prediction” by Roni Bar-David and Mark Last, the authors
describe an approach for predicting future locations of vehicles utilizing various types
of context information.
It is the hope of the editors that this book (a) catches the attention of an audience
interested in recent problems and advancements in the fields of big data analytics,
social media, and ubiquitous data and (b) helps to spark a conversation on new
problems related to the engineering, modeling, mining, and analysis in the field of
ubiquitous social media and systems integrating these.
We want to thank the workshop and proceedings reviewers for their careful help in
selecting and the authors for improving the submissions. We also thank all the authors
for their contributions and the presenters for the interesting talks and the lively dis-
cussions at the three workshops. Their efforts and contributions allowed us to produce
such a book.

November 2015 Martin Atzmueller


Alvin Chin
Frederik Janssen
Immanuel Schweizer
Christoph Trattner
Organization

Program Committee
Martin Atzmueller University of Kassel, Germany
Alvin Chin BMW Group, USA
Bin Guo Institut Telecom SudParis, France
Sharon Hsiao Arizona State University, USA
Kris Jack Mendeley, UK
Frederik Janssen Knowledge Engineering Group, TU Darmstadt, Germany
Mark Kibanov University of Kassel, Germany
Harold Liu Beijing Institute of Technology, China
Eneldo Loza Mencia Knowledge Engineering Group, TU Darmstadt, Germany
Andreas Schmidt University of Kassel, Germany
Benedikt Schmidt TU Darmstadt, Germany
Immanuel Schweizer TU Darmstadt, Germany
Christoph Trattner KMI, TU Graz, Austria
Eduardo Veas TU Graz, Austria
Christian Wirth TU Darmstadt, Germany
Zhiyong Yu Fuzhou University, China
Arkaitz Zubiaga University of Warwick, UK
Contents

Using Wikipedia for Cross-Language Named Entity Recognition . . . . . . . . . 1


Eraldo R. Fernandes, Ulf Brefeld, Roi Blanco, and Jordi Atserias

On the Predictive Power of Web Intelligence and Social Media:


The Best Way to Predict the Future Is to tweet It . . . . . . . . . . . . . . . . . . . . 26
Nathan Kallus

A Latent Space Analysis of Editor Lifecycles in Wikipedia . . . . . . . . . . . . . 46


Xiangju Qin, Derek Greene, and Pádraig Cunningham

On Spatial Measures of Geographic Relevance for Geotagged Social Media


Content . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 70
Xin Wang, Tristan Gaugel, and Matthias Keller

Formation and Temporal Evolution of Social Groups During Coffee Breaks . . . 90


Martin Atzmueller, Andreas Ernst, Friedrich Krebs, Christoph Scholz,
and Gerd Stumme

A Habit Detection Algorithm (HDA) for Discovering Recurrent Patterns


in Smart Meter Time Series . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 109
Rachel Cardell-Oliver

RoADS: A Road Pavement Monitoring System for Anomaly Detection


Using Smart Phones . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 128
Fatjon Seraj, Berend Jan van der Zwaag, Arta Dilo, Tamara Luarasi,
and Paul Havinga

Mining Ticketing Logs for Usage Characterization with Nonnegative


Matrix Factorization . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 147
Mickaël Poussevin, Emeric Tonnelier, Nicolas Baskiotis,
Vincent Guigue, and Patrick Gallinari

Context-Aware Location Prediction . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 165


Roni Bar-David and Mark Last

Author Index . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . . 187


Using Wikipedia for Cross-Language Named
Entity Recognition

Eraldo R. Fernandes1 , Ulf Brefeld2(B) , Roi Blanco3 , and Jordi Atserias4


1
Universidade Federal de Mato Grosso Do Sul, Campo Grande, Brazil
2
Leuphana University of Lüneburg, Lüneburg, Germany
brefeld@leuphana.de
3
Yahoo! Labs, London, UK
4
University of the Basque Country, Donostia, Spain

Abstract. Named entity recognition and classification (NERC) is fun-


damental for natural language processing tasks such as information
extraction, question answering, and topic detection. State-of-the-art
NERC systems are based on supervised machine learning and hence
need to be trained on (manually) annotated corpora. However, anno-
tated corpora hardly exist for non-standard languages and labeling addi-
tional data manually is tedious and costly. In this article, we present a
novel method to automatically generate (partially) annotated corpora for
NERC by exploiting the link structure of Wikipedia. Firstly, Wikipedia
entries in the source language are labeled with the NERC tag set. Sec-
ondly, Wikipedia language links are exploited to propagate the anno-
tations in the target language. Finally, mentions of the labeled entities
in the target language are annotated with the respective tags. The pro-
cedure results in a partially annotated corpus that is likely to contain
unannotated entities. To learn from such partially annotated data, we
devise two simple extensions of hidden Markov models and structural
perceptrons. Empirically, we observe that using the automatically gen-
erated data leads to more accurate prediction models than off-the-shelf
NERC methods. We demonstrate that the novel extensions of HMMs
and perceptrons effectively exploit the partially annotated data and out-
performs their baseline counterparts in all settings.

1 Introduction

The goal of named entity recognition and classification (NERC) is to detect and
classify sequences of strings that represent real-world objects in natural language
text. These objects are called entities and could for instance be mentions of
people, locations, and organizations. Named entity recognition and classification
is thus a fundamental component of natural language processing (NLP) pipelines
and a mandatory step in many applications that deal with natural language
text, including information extraction, question answering, news filtering, and
topic detection and tracking [32] and has received a great deal of interest in the
past years.

c Springer International Publishing Switzerland 2016
M. Atzmueller et al. (Eds.): MSM, MUSE, SenseML 2014, LNAI 9546, pp. 1–25, 2016.
DOI: 10.1007/978-3-319-29009-6 1
2 E.R. Fernandes et al.

State-of-the-art methods for detecting entities in sentences use machine learn-


ing techniques to capture the characteristics of the involved classes of entities.
Prominent methods such as conditional random fields [22,23] and structural
support vector machines [2,45,47] need therefore to be adapted to annotated
data before they can be deployed. Such data is for instance provided by initia-
tives such as CoNLL1 that put significant effort in releasing annotated corpora
for practical applications in major languages including English, German [40],
Spanish, Dutch [39], Italian2 , and Chinese [48]. Although there are corpora for
a few minor languages such as Catalan [27], there exist about 6,500 different
languages and a large fraction thereof is not covered by NLP resources at all.
From a practitioners point of view, the performance of NERC systems highly
depends on the language and the size and quality of the annotated data. If the
existing resources are not sufficient for generating a model with the required
predictive accuracy the data basis needs to be enlarged. However, compiling a
corpus that allows to learn models with state-of-the-art performance is not only
financially expensive but also time consuming as it requires manual annotations
of the collected sentences. Frequently, the annotation cannot be left to laymen
due to the complexity of the domain and it needs to be carried out by trained
editors to deal with the pitfalls and ambiguity. In the absence of appropriate
resources in the target language, the question rises whether existing corpora in
another, perhaps well-studied language could be leveraged to annotate sentences
in the target language. In general, cross-lingual scenarios, for instance involving
parallel corpora, provide means for propagating linguistic annotations such as
part-of-speech tags [12,50], morphological information [43], and semantic roles
[35]. In practice, however, creating parallel corpora is costly as, besides anno-
tating the text, sentences need to be aligned so that translation modules can be
adapted. Existing parallel corpora are therefore often small and specific in terms
of the covered domain.
In this article, we study whether multilingual and freely available resources
such as Wikipedia3 can be used as surrogates to remedy the need for annotated
data. Wikipedia, the largest on-line encyclopedia, has already become a widely
employed resource for different NLP tasks, including Word Sense Disambiguation
[30], semantic relatedness [18] or extracting semantic relationships [38]. So far,
only few contributions involving Wikipedia focus on multilingual components
such as cross-language question answering [16].
We present a novel approach to automatically generate (partially) anno-
tated corpora for named entity recognition in an arbitrary language covered
by Wikipedia. In the remainder, we focus on NERC and note that our app-
roach is directly applicable to other NLP tasks such as part-of-speech tagging
and word sense disambiguation. Our method comprises three stages. In the first
stage, Wikipedia entries are labeled with the given NERC tag set. The second
stage uses Wikipedia language links to map the entries to their peers in the

1
http://ifarm.nl/signll/conll/.
2
http://evalita.fbk.eu/.
3
http://www.wikipedia.org/.
Using Wikipedia for Cross-Language Named Entity Recognition 3

target language. The third stage consists of annotating the detected entities in
sentences in the target language with their corresponding tag. Note that the
methodology leaves entities that are not linked within Wikipedia unannotated.
Consequentially, the procedure results in partially labeled corpora which likely
contain unannotated entities. We therefore devise two novel machine learning
algorithms that are specifically tailored to process and learn from such partially
annotated data based on hidden Markov models (HMMs) and structural per-
ceptrons.
Empirically, we demonstrate that with simple extensions, machine learning
algorithms are able to deal with this low-quality inexpensive data. We eval-
uate our approach by automatically generating mono- and cross-lingual cor-
pora that are orders of magnitude larger than existing data sets. Empirically,
we observe that using the additional data improves the performance of regular
hidden Markov models and perceptrons. The novel semi-supervised algorithms
significantly improve the results of their baseline counterparts by effectively
exploiting the nature of the partially annotated data.
The remainder is structured as follows. Section 2 reviews related approaches
to generate corpora using Wikipedia. We present the automatic generation
of cross-lingual corpora using Wikipedia in Sect. 3 and Sect. 4 introduces the
machine learning methods for learning from partially labeled data. We report
on our empirical results in Sect. 5 and Sect. 6 concludes.

2 Wikipedia-Based Corpus Generation


There are several techniques that classify Wikipedia pages using NERC labels as
a preliminary step for different applications. Some of those applications include,
for instance, to extend WordNet with named entities [46], to provide additional
features for NERC [21], or even to classify Flickr tags [34]. However, how these
techniques can be employed to generate tagged corpora is largely understudied.
In the remainder of this section, we review three approaches that are related to
our work.
Mika et al. [31] aim to improve named entity recognition and classification
for English Wikipedia entries using key-value pairs of the semi-structured info
boxes. Ambiguity is reduced by aggregating observed tags of tokens (the values)
with respect to the fields of the info boxes (the keys). Regular expressions are
used to re-label the entities. Rather than complete sentences, the final output
consists of text snippets around the detected entities. Their approach ignores
language links and is therefore restricted to mono-lingual scenarios.
Nothman et al. [33] and Richman and Schone [37] propose methods to assign
NERC tags to Wikipedia entries by manually defined patterns, key phrases, and
other heuristics, respectively. [37] for instance devise key phrases that serve as
a simple heuristic for assigning labels to categories and observe reasonable pre-
cision by tagging categories containing the words people from as person, those
including the word company as organization, and those including country as
location, etc. The two approaches focus on extracting completely annotated sen-
tences which results in two major limitations. There is the risk of erroneously
4 E.R. Fernandes et al.

annotating tokens due to overly specified rules and heuristics because sentences
must be annotated completely and consequentially, large parts of the corpus are
discarded because they are likely to contain false negatives (entities which are
not annotated). Compared to [37], we take a different approach by only anno-
tating entities with high confidence and leaving the remaining tokens unlabeled.
By doing so, our method acts on a much larger data basis. The final models are
trained on the partially annotated sentences and render the use of heuristics and
manually crafted rules unnecessary.
Alternative approaches to ours are self-training or distant supervision meth-
ods. Knowledge bases like Wikipedia are used to automatically extract informa-
tion (e.g., entities) that are used to train a classifier which is then used to detect
even more entities in the resource, etc. [4]. A general problem with self-training
is that the initial models are trained on only a few data points and often do not
generalize well. As a consequence, erroneous tags enter the training data and
may dominate the whole training process.

3 Generating Annotated Corpora Using Wikipedia


This section presents our approach to automatically generate (partially) anno-
tated corpora for named entity recognition and classification. Our method
exploits the link structure of Wikipedia as well as the linkage between Wiki-
pedias in different languages. The proposed methodology consists of 3 stages.
Firstly, Wikipedia entries in the source language are annotated with the respec-
tive NERC tag set (Sect. 3.1). Secondly, the annotated entries are projected
into the target language by following cross-lingual Wikipedia links (Sect. 3.2).
Thirdly, anchor texts in the target language linking to previously annotated
entries are labeled with the corresponding tag (Sect. 3.3).
Figure 1 illustrates the cross-lingual setting for English (left, source language)
and Spanish (right, target language). For each language, there are two entries
linking to the river Danube (Spanish: Danubio). The black pointer indicates the
language link from the Spanish Wikipedia page to its peer in English. To generate
a corpus in Spanish using English as source language we proceed as follows. The
mentions of Danube are tagged as location and propagated by links 1 and 2 to
the Danube entry. In our simple scenario, the resulting distribution (person:0,
location:2, ...) clearly indicates that this entry should be annotated as a location.
Using the Wikipedia language link (link 3), the annotation is propagated to the
Spanish entry Danubio which is also tagged as location. Finally, anchor texts in
the Spanish Wikipedia of links four and five pointing to Danubio are accordingly
annotated as locations. We obtain a partial annotation of the Spanish Wikipedia
where mentions of Danubio are tagged as location.
Table 1 shows an exemplary sentence and its partial annotation. According
to described procedure, Danubio is successfully annotated as a location. Words
that are not linked to Wikipedia entries such as que as well as words that do
correspond to Wikipedia entries but have not been processed yet such as Carlo-
magno remain unlabeled. Since not all entries can be resolved, the final corpus
is only partially annotated.
Using Wikipedia for Cross-Language Named Entity Recognition 5

Fig. 1. Wikipedia link structure.

Table 1. A partially annotated sentence.

Carlomagno contribuyó a que el Danubio fuese navegable


? ? ? ? ? B-LOC ? ?

In the remainder, we focus on the English CoNLL-2003 tags, however we


note that the choice of the tags is problem dependent and the incorporation of
other tagsets is straight forward. The CoNLL-2003 tags are PER (person), LOC
(location), ORG (organization), MISC (miscellaneous), and O (not an entity).
In the following, we introduce our strategy in greater detail.

3.1 Annotating Wikipedia Entries

Our approach to labeling Wikipedia entries with elements of the tag set is based
on existing resources. More specifically, we use the freely-available version of
Wikipedia from [3], which provides a version of the English Wikipedia with
several levels of semantic and syntactic annotations. These annotations have
been automatically generated by state-of-the-art algorithms (see [3] for details).
Moreover, this corpus preserves the Wikipedia link structure.
Note that the maximal possible number of annotations of the corpus depends
on the number of links pointing to the Wikipedia entries in the source language.
While some entries such as Danube are supported by more than 1,000 mentions
6 E.R. Fernandes et al.

Table 2. Mismatch of annotation (center row) and linked text (bottom row) for an
exemplary sentence.

· · · are of the Corts of Barcelona from 1283


··· O O O B-MISC O B-LOC O O
··· O O O wiki/Corts of Barcelona O wiki/1283

others such as Holidays with Pay (Agriculture) Convention, 1952 are almost not
interlinked at all within Wikipedia. As a consequence, annotations will hardly
be generated from this entry and the existing ones may be noisy due to ambi-
guity. However note that even if only highly interlinked entries are selected, a
considerably large set of entries needs to be labeled to build a corpus with a
reasonable number of annotations.
We proceed by propagating the annotations to the entries. Every tagged
anchor link that is concisely tagged propagates its annotation, while mismatches
between linked text and annotation are discarded. Table 2 shows an example of
such a mismatch. The link Cort of Barcelona remains unused because neither
MISC or LOC completely cover the linked text. Recall Fig. 1 for another exam-
ple. The anchor text linked to the English Wikipedia page Danube (links 1 and
2) is tagged as a location and the corresponding label LOC is assigned to the
entry. The major advantages of this approach are twofold. First, it significantly
reduces the human effort as no manual annotations are needed. Second, it does
not depend on the language dependent category structure. Thus, this approach
is generally applicable with any tagged subset of Wikipedia.
Table 3 shows the number of perfect matches between tags and Wikipedia
links. Very frequent entries such as Barcelona or Danube are mostly tagged as
locations while others like Barcelona Olympics do not show a clearly identifiable
peak or are even associated with more than one label as for instance the entry
Barnet. In general, there are many links to a Wikipedia page and the provided
tags are not always perfect. It is thus necessary to reduce the number of ambigu-
ous entities, that is Wikipedia entries that can be associated to more than one
tag such as schools which can be either tagged as organization or as location,
depending on the context.
Our approach however naturally allows for detecting ambiguous entities as
all occurrences of tags are collected for an entry. Their counts simply serve as
indicators to detect ambiguity. We observe a clear peak in the tag-distribution
when an entity is not ambiguous; the majority of the annotations correspond to
the true class of the respective entities. Thus, a simple strategy to reduce the
noise of the tagging and to select a unique label for an entry is to perform a
majority voting which corresponds to a maximum-a-posteriori prediction given
the tag distribution. In practice, it is beneficial to incorporate a threshold θ to
select only those Wikipedia entries that have been tagged at least θ-times and
to filter entries whose ratio between the first and the second most common label
is greater than α.
Using Wikipedia for Cross-Language Named Entity Recognition 7

Table 3. Example of the different counting associated to CoNLL labels

LOC PER ORG MISC


Danube 1391 31 16 8
Barcelona 3,349 14 1 0
Barcelona Olympics 2 4 2 5
Barnet 33 10 74 0

Table 4 shows the label distribution for θ = 30 and α = 0.4 (Wikipedia) for
65,294 Wikipedia entries that are labeled by our method. For comparison, we
include the approach by [37] (Category), which maps Wikipedia categories4 to
named entity tags. When applying this tagging technique, we use the same set of
key phrases and results from [46], who labeled Wikipedia categories manually. In
a few cases multiple assignments are possible; in these cases, we assign the tags
to the category matching the most key phrases. Using the category strategy, we
obtain NE labels for 755,770 Wikipedia entries. Note that there is no Wikipedia
entry assigned to MISC as the original list of key phrases does not include a list
for the tag miscellaneous. Further note that it is generally difficult to define key
phrases and detection rules for inhomogeneous entity classes such as miscella-
neous which are often inalienable in NER as they pool entities that cannot be
associated with high confidence to one of the other classes. Another drawback of
the category approach is that the entries are found via the Wikipedia category
structure and that there is no guarantee for obtaining highly interlinked entries.
Recall that the number of annotated entities in our procedure is equivalent to
the number of links pointing to entries. The number of resulting annotations
cannot be controlled by the category approach. For instance, the category app-
roach leads to 13 M and 800 K entities for the mono-lingual English → English
and the cross-language English → Spanish experiments, respectively. While our
approach resulted in 19 M and 1.8 M entities, respectively.

3.2 Cross-Lingual Propagation

Once the NERC tags are assigned to Wikipedia entries in the source language,
we project these assignments to Wikipedia entries in the target language. This
approach exploits the cross-lingual links between Wikipedias in the respective
languages, provided that a Wikipedia cross-language link exists between two
entries.
Note that links are not bi-directional, that is the existence of a link in one
direction does not necessarily imply the existence of the opposite direction.
Table 5 shows the number of language links between the English Wikipedia and
some smaller Wikipedias in French (1,008,744 entries), Spanish (655,537 entries),
Catalan (287,160 entries), Dutch (684,105 entries) and Icelandic (29,727 entries).

4
https://en.wikipedia.org/wiki/Help:Category.
8 E.R. Fernandes et al.

Table 4. Entity distribution for our method (Wikipedia), the category approach [37]
(Category), and manually labeled results from [46] (Manual).

Wikipedia Category Manual


Label Entries % Entries % Entries %
LOC 12,981 19.8 149,333 19,7 404 11.4
ORG 17,722 27.1 107,812 14,2 55 1.5
PER 29,723 45.5 498,625 65,9 236 6.7
MISC 4,868 7.4 - - - -
O - - - - 2,822 80.2
AMB - - - - - -
65,294 755,770 3,517

Table 5. Wikipedia cross-language links.

Links direction #Links


French → English 730,905
English → French 687,122
Spanish → English 480,336
English → Spanish 475,921
Catalan → English 200,090
English → Catalan 163,849
Dutch → English 167,154
English → Dutch 145,089
Icelandic → English 29,623
English → Icelandic 25,887

Particularly for non-popular languages, the number of cross-lingual links from


and to the English Wikipedia varies. Moreover, some of the links are not updated,
mistyped, or use different character encodings. For instance, we are only able
to map 262,489 Spanish Wikipedia entries out of the 480,336 language links
to the corresponding English counterparts. The opposite direction is supported
only by 160,918 entries. Nevertheless, apart from the coverage, the cross-lingual
propagation can be considered as almost error-free.

3.3 Corpus Annotation


Once the tags are assigned to Wikipedia entries in the target language, the
anchor text of the links pointing to tagged entries are annotated with the respec-
tive tag. We obtain a partially annotated corpus, as we have no information
about annotations for text outside the entity link. The next section deals with
machine learning techniques to learn from these partially annotated sentences.
Using Wikipedia for Cross-Language Named Entity Recognition 9

4 Learning from Partially Annotated Data


Traditionally, sequence models such as hidden Markov models [20,36] and vari-
ants thereof have been applied to label sequence learning [14] tasks. Learning
procedures for generative models adjust the parameters such that the joint like-
lihood of training observations and label sequences is maximized. By contrast,
from an application point of view, the true benefit of a label sequence pre-
dictor corresponds to its ability to find the correct label sequence given an
observation sequence. Many variants of discriminative sequence models have
been explored, including maximum entropy Markov models [29], perceptron re-
ranking [2,10,11], conditional random fields [23,24], structural support vector
machines [2,47], and max-margin Markov models [45]. In this Section, we present
extensions of hidden Markov models and perceptrons that allow for learning from
partially labeled data.
A characteristic of the automatically generated data is that it might include
unannotated entities. For instance, entity mentions may not be linked to the
corresponding Wikipedia entry or do not have an associated Wikipedia entry.
In cross-language scenarios, linked entries in the target sentences may not be
present in the source Wikipedia and thus cannot be resolved. While labeled
entities in the automatically generated data are considered ground-truth, the
remaining parts of the sentence likely contain erroneous annotations and the
respective tokens are thus treated as unlabeled rather than not an entity.
The following section introduces the problem setting formally. Sections 4.2
and 4.3 present hidden Markov models and perceptrons for learning with par-
tially labeled data, respectively. Section 4.6 discusses ways to parameterize the
methods and Sect. 4.7 details their parallelization for distributed computing.

Table 6. An exemplary sentence tagged with the mentioned entities.

x1 x2 x3 x4 x5 x6 x7
x = The Danube is Europe ’s second longest · · ·
y= O LOC O LOC O O O ···
y1 y2 y3 y4 y5 y6 y7

4.1 Preliminaries

The task in label sequence learning [14] is to learn a mapping from a sequential
input x = (x1 , . . . , xT ) to a sequential output y = (y1 , . . . , yT ), where each
observed token xt ∈ Ω is annotated with an element of a fixed output alphabet
yt ∈ Σ, see Table 6 for an example. Additionally, we observe some ground-truth
annotations of input x denoted by the set z = {(tj , σj )}mj=1 where 1 ≤ tj ≤ T
and σj ∈ Σ.
Another random document with
no related content on Scribd:
— Comme je suis content de vous voir ! dit-il en prenant mes
deux mains.
Et ce contentement d’abord, évident et vif, l’empêcha de
remarquer que j’étais seule. Il s’en aperçut brusquement, et tout
confus de sa distraction, rougit et s’embarrassa si bien dans ses
excuses que nous nous mîmes à rire tous les deux. J’expliquai
ensuite, selon les instructions de Fabien, que mon mari était malade,
point gravement, assez toutefois pour n’avoir pu m’accompagner, ce
dont il se désolait. Et nous suivîmes vers la maison l’allée où les
châtaigniers et les acacias gardaient assez de feuilles encore pour
mettre sur la poussière une ombre dansante.
Il y eut à ce moment entre Philippe Fabréjol et moi un petit
silence, et nous dûmes l’un et l’autre l’occuper de la même façon,
car en même temps il me demanda :
— Ces beaux voyages dont vous rêviez, madame, avez-vous pu
les faire ?
Et je lui dis :
— Ce pavillon de la Reine, l’a-t-on bien élevé, comme vous le
souhaitiez, avec son toit en dôme et ses petites sculptures ?
Le souvenir de l’heure charmante qui nous avait un jour réunis
prenait de singulières et vives précisions. Chacun de nous avait
conservé dans sa mémoire toutes les paroles. Il se souvenait de
mes petits rêves, je n’avais pas oublié ses beaux projets ; et, dans le
temps que nous mîmes à atteindre la maison, nous avions repris
notre causerie au point même où il nous avait fallu l’abandonner trois
ans auparavant.

… Je me rappelle l’entrée dans cette grande maison, aux


fenêtres larges ouvertes, et que tant d’arbres pressés autour d’elle et
chargés d’un or magnifique semblaient pénétrer de leur
rayonnement. Le salon, avec ses meubles provençaux et les
verdures bleuâtres qui tapissaient sa haute muraille, était tout rempli
de souriants visages. M. Fabréjol et sa sœur Philomène, également
enjoués sous leurs lourds cheveux blancs ; un couple de leurs amis,
les Meynadier, vieux ménage dont quarante ans d’union n’avaient
point épuisé la visible tendresse ; et jusqu’à Mme Fabréjol, peinte à
trente ans, éclatante et jolie au-dessus des fleurs que l’on
renouvelait chaque jour devant son portrait, me firent un de ces
accueils par lesquels, soudain, tout le cœur s’épanouit. Une gaîté
paisible et profonde, telle que je n’en avais jamais connue, flottait
dans cette pièce. Elle m’enveloppa aussitôt. — Elle me pénétra
mieux ensuite durant le repas joyeux, dans la claire salle à manger
que parfumaient les dernières roses. Et c’était comme un vin doux et
sournois dont l’ivresse engourdit avant que l’on ait songé à la
redouter. M. Fabréjol parlait de ses beaux domaines dans l’Algérie
éblouissante et nous conviait tous à l’y aller voir. Les Meynadier,
racontant les changements opérés dans leur petite propriété, leur
dernier voyage à Paris, leurs projets pour l’hiver, ne pouvaient
prononcer une parole qui n’évoquât leur vieux et profond bonheur.
Philippe, assis près de moi, me disait quelquefois : « Vous rappelez-
vous ? » comme si beaucoup de jours et de mois, — au lieu d’une
heure seulement, — avaient formé nos communs souvenirs. — Et
toute la peine de mon cœur s’en était allée je ne sais où.
Elle se cachait plus loin encore, tandis que Philippe Fabréjol, un
peu plus tard, laissant sa tante et leurs hôtes se reposer au salon,
m’emmenait voir au fond du vallon le pavillon de la Reine. M.
Fabréjol devait nous accompagner, mais un de ses fermiers vint
pour lui parler. Nous l’attendîmes quelques instants, puis Philippe
décida qu’il nous rejoindrait là-bas, et nous allions maintenant tous
les deux à travers le jardin roux et vert qui sentait à la fois l’été
mourant et le délicieux automne.

Le chemin descendait entre des troènes et des buis. De trois


grands réservoirs qui servaient à l’irrigation du verger, l’eau fuyait à
petit bruit vers le profond ruisseau. Philippe Fabréjol m’expliquait
que son père avait fait construire ces réservoirs à l’exemple de ceux
qui valaient à leurs terres d’Algérie tant d’abondance et de fécondité.
Il me parlait des champs, des vignes et des jardins, et me racontait
leur libre vie, là-bas, les courses à cheval, les soirées lumineuses
devant la maison blanche, la mer que l’on aperçoit au loin, toute
petite, pierre précieuse, émail limpide, triangle d’argent bleu ou d’or
verdâtre étincelant entre deux collines. Nous avions quitté le chemin
et, sur cette pente humide où nous marchions, l’herbe épaisse, fine
et très verte, était douce à nos pas.
Elle se continuait ainsi jusqu’au fond du vallon et le pavillon de la
Reine était au milieu de ce beau tapis. Je ne pense revoir rien de
plus charmant que ce petit temple dont six colonnettes ornées de
cannelures et de feuillages portaient légèrement la ronde coupole.
Des rosiers tout chargés de leur floraison d’automne passaient leurs
branches entre ces colonnes, et les pétales trop mûrs tachaient de
safran et de carmin le banc de marbre étroit et poli qui s’incurvait à
l’intérieur. Philippe m’y fit asseoir après que j’eus bien tourné tout
autour du léger édifice, dans un ravissement puéril et profond ; et
laissant alors paraître dans ses yeux bleus une sympathie plus
grave soudain et plus attentive :
— Maintenant, me dit-il, parlons un peu de vous, si vous le
voulez bien.
Mais quelque douceur que me fît connaître son regard, il m’était
plus doux encore en ce moment d’oublier cette créature tourmentée
sur laquelle il m’interrogeait, et je ne permettais pas que l’on me
ramenât vers elle.
— Non… non… dis-je un peu trop vite et secouant la tête, je ne
veux pas.
— Pourquoi donc ?
Je me tus. Et c’était là peut-être la plus dangereuse confidence.
Philippe Fabréjol n’osa pas me regarder davantage. Mais ayant un
long moment réfléchi :
— Vous ne devez pas, murmura-t-il, être très heureuse.
François Landargues, un jour, m’avait dit la même phrase.
Hélas !… pouvais-je désormais, pour le comparer à un autre et pour
le détester mieux encore, me rappeler François Landargues ?… Et
tout éperdue d’être ainsi tirée malgré moi vers ce que je ne voulais
pas revoir :
— Je ne sais pas… Je ne sais pas… Ne parlons pas de cela.
Il répéta pensivement :
— Et pourquoi donc ?
Puis aussitôt, confus de cette insistance :
— Pardonnez-moi. Nous nous sommes vus avant aujourd’hui
une fois seulement. Nous ne nous connaissons pas. Et cependant…
il faut que je vous le dise et ce sera mon excuse… souvent, là-bas,
par ces beaux soirs dont je vous parlais, à l’heure du repos sur la
terrasse d’où l’on voit la mer, il me semblait être en France, dans
une ville… une très petite ville, avec de petites rues serrées,
farouches, ennuyeuses… J’entrais dans un salon un peu sombre…
un peu triste… Et je revoyais là une femme… une jeune femme…
Souvent, oui… cela m’est arrivé très souvent… C’est singulier, n’est-
ce pas ?… Le souvenir !… Et nous nous étions vus si brièvement !…
Nous n’avions dit que de simples paroles… Mais c’est à cause de
cela, comprenez-vous, que je me suis permis de vous demander…
Il ne répéta plus cette demande, mais il m’en fit une autre, après
un silence :
— Nous allons bientôt repartir. Me permettrez-vous d’aller vous
dire adieu ? Mon père m’a dit, je crois, que vous logiez dans la rue
des Trois-Faucons.
Cette fois encore, puisque dans mon misérable état on ne
pouvait rien me dire qui ne rappelât mon angoisse, j’allais répondre :
« Non, il ne faut pas ! » parce que j’imaginais Fabien, et sa
sauvagerie, et toutes ces blessures qu’il recevrait, lui aussi, des
moindres paroles… Mais la voix de M. Fabréjol, forte et joyeuse, cria
tout près de nous :
— Vous vous êtes installés dans le pavillon : voulez-vous,
madame, y tenir la cour d’amour pour les roses et les grenadiers ?
Nous retournâmes avec lui vers la maison. Et un peu plus tard,
comme la nuit vient vite en automne, il fallut se séparer. Les
Meynadier, dont la propriété était voisine, s’en allèrent à pied, un peu
lourds, un peu lents, mais se tenant par le bras et se penchant l’un
vers l’autre. On tira mon cocher de l’office et mon cheval de l’écurie,
et le grinçant équipage me remporta sur les chemins. Ils étaient
clairs encore, mais commencèrent bientôt de s’assombrir. Et la
grande douceur qui demeurait autour de moi et dans laquelle je
continuais de vouloir tout oublier se dissipa peu à peu à mesure que
je m’éloignais de la maison heureuse. En vain je m’efforçais de la
retenir. Quand je cessai de voir, en me retournant, l’ombre plus
profonde du vallon entre les collines crépusculaires, je fermai les
yeux… et je ne me défendis pas de retourner dans le pavillon de la
Reine. J’y étais encore quand les pavés d’Avignon commencèrent
de me secouer durement, et je m’obstinais sans doute à n’en pas
bouger, tandis qu’ayant quitté ma voiture sur la place, distraite et
lente, je gagnais à pied la rue des Trois-Faucons. Elle est peu
passagère et mal éclairée. La maison me parut sombre et l’escalier
presque effrayant. J’ouvris la porte et ne vis rien d’abord qu’une
ombre plus profonde. « Sans doute, pensai-je, Fabien n’est pas
encore rentré. » Mais aussitôt je distinguai sa silhouette immobile
dans le cadre de la fenêtre ouverte.
— Eh bien ? me demanda-t-il d’une voix morne.
J’interrogeai à mon tour, avant de lui répondre :
— Tu es sorti aujourd’hui ?
— Non.
— Qu’est-ce que tu as fait ?
— Rien.
… Tout le jour, dans cette chambre, une âme douloureuse, seule
en face du plus abominable souvenir, l’avait subi en gémissant,
s’était soulevée, débattue et se repliant sur son mal pour essayer de
l’étouffer, n’avait pu que s’en pénétrer davantage. Et il n’était besoin
pour connaître cela d’avoir entendu aucune confidence. Comme on
sentait le bonheur en entrant dans le salon des Fabréjol, on respirait
ici l’odeur de l’angoisse. Elle venait à moi ; elle me pénétrait ; elle
m’étourdissait comme un mauvais vin dont on voudrait se détourner
et qui vous impose cependant ses malsaines vapeurs. Comme il
avait souffert aujourd’hui, et comme pendant ce temps j’étais loin de
lui !… Ah ! plus loin, n’est-ce pas ? que la maison des Fabréjol, plus
loin que le royaume des Baux, dont je m’étais plu à entendre parler,
plus loin encore que ce pays d’Alger… loin… plus loin. Et tout en
allumant la lampe, en préparant la table, en essayant de rendre à la
morne chambre un peu de vie, j’éprouvais le besoin de dire :
« Pardonne-moi ! »

*
* *

Je ne devais pas oublier la tristesse de ce retour après la douce


journée. Une fois de plus, le remords de ma négligence me secoua
et me fut salutaire. Il réveilla en moi les forces attentives. Il me
soutint sur ce chemin difficile que je voulais bien suivre, mais où je
défaillais trop souvent. Et je m’appliquai avec plus de soin à mériter
qu’un jour me fût fait l’aveu terrible qui seul pouvait être le
commencement du salut.
L’animation fébrile qu’avait donnée à Fabien la rencontre de M.
Fabréjol l’avait laissé, en se dissipant, plus abattu. Il ne m’avait posé
que de vagues questions sur ma journée à Pampérigouste, et,
pendant ce long dimanche où il n’avait pu regarder que lui-même,
son intérêt avait bien réellement fini de se détacher de tout. Mais il
semblait maintenant trouver près de moi le peu de contentement
qu’il put connaître encore.
Nos promenades communes étaient devenues pour lui une
habitude. Il s’impatientait si je ne pouvais l’accompagner ; quand je
lui parlais un peu longuement, il me laissait dire, sans m’interrompre
aussitôt et sans hausser les épaules. Le matin, quelquefois, il
préférait ne pas sortir et tandis que j’aidais notre servante à mettre
les deux pièces en ordre, il restait là, inactif et ne me quittant guère
des yeux. Il remarqua une fois :
— Tu te fatigues.
Un autre jour, étant sorti, il rentra presque animé et me montrant
deux livres épais dont la tranche avait été noircie par la poussière et
la couverture bleue jaunie par le soleil :
— Tu vois, dit-il, j’ai suivi ton conseil, je les ai trouvés chez
Roumanille. Un peu défraîchis, mais à moitié prix. Ils traitent des
antiquités de la région et principalement, figure-toi, des médailles et
des poteries.
Et je fus touchée qu’il répétât :
— J’ai suivi ton conseil.
Ce conseil, donné les premiers jours et si mal accueilli, j’avais
osé le rappeler la veille, et Fabien l’avait entendu sans colère. La
lecture désormais occupa chaque jour une ou deux de ses heures. Il
voulait s’y intéresser, prenait même quelques notes, ébauchait ce
fameux article que l’on imprimerait à Privas. Et certes, bien souvent,
il rejetait le livre, écrasait nerveusement sa plume sur le papier,
s’accoudait à la table sans plus rien vouloir faire. Mais cet effort, ce
commencement d’effort, me donnait la même joie que j’avais
ressentie de sa bonne intention, le jour qu’il était retourné pour voir
le bohémien blessé. Et la qualité de cette joie était telle que tout mon
cœur s’enrichissait à la recevoir.
Je ne sentais plus devant Fabien cette espèce de gêne qui
m’empêchait de bien savoir quelles paroles il était bon de prononcer.
Elles me venaient maintenant en abondance ; et lui-même ne me
répondait plus sur ce ton bref et lassé qui coupait si promptement
tous nos entretiens. Je continuais à ne lui rien dire de Lagarde, de
notre vie passée, ni de lui-même. Je savais qu’il ne l’aurait pas
permis encore. J’essayais, au delà de nous, au-dessus de nous,
d’atteindre malgré mon ignorance à de petites idées. Il acceptait de
les considérer avec moi, il en discutait quelquefois. Rien ne lui était
bon que ma présence. Rien ne m’était meilleur que cet humble
besoin qu’il avait de moi. Et tout isolés, avec notre grande douleur,
dans cet Avignon tumultueux, éclatant, dont la joie depuis tant de
siècles fait sonner son carillon à travers la Provence, de jour en jour,
d’une façon inconsciente et profonde, nous nous rapprochions l’un
de l’autre.
Cependant, je n’avais pas oublié la maison des Fabréjol et
malgré ce grand remords, le soir de mon retour, il m’advenait encore
de m’y retrouver. Ma tâche, soudain, m’apparaissait vaine et trop
difficile. Mes épaules pliaient sous le poids trop lourd, mes mains
lâchaient prise. Je glissais dans l’herbe molle d’un vallon où toutes
les roses du printemps avaient mis leur bonne odeur ; et je serrais
longuement mes paupières sur mes yeux qu’avait trop profondément
pénétrés le regard de deux yeux bleus.
… Ces yeux étaient près de moi, et je respirais ces roses, un jour
que, me trouvant seule rue des Trois-Faucons, j’entendis sur la
vieille porte retentir le marteau aux serpents entrelacés. Ce n’était
pas Fabien, ce n’était pas Chayère, qui frappait ainsi. Ils avaient leur
clef l’un et l’autre et je ne pensai pas un instant que l’un ou l’autre
pouvait l’avoir oubliée. Je me levai. Je courus à mon miroir. J’étais
tout hésitante et ne savais que faire. Et puis je descendis lentement
l’escalier, et je n’avais pas besoin que la porte fût ouverte pour
apprendre qui était là.
— Bonjour, madame, dit Philippe Fabréjol de sa belle voix
cordiale.
— Bonjour, monsieur.
Je ne le priai pas d’entrer tout de suite… Je savais bien que
c’était lui. Je le savais. Mais à présent seulement j’en éprouvais la
brusque surprise. Je murmurai :
— Vous êtes venu ?…
— Oui, répondit-il, comme je vous l’avais annoncé, pour vous
faire mes adieux…
Il regardait ma coiffure un peu défaite, mes manches courtes,
mon petit tablier de percale festonnée à carreaux gris ; et ce regard
était tel que je n’éprouvais, d’être aussi mal mise, aucune confusion.
— Vous partez déjà !
— Peut-être… Je vais vous raconter.
Et il demanda :
— Votre mari est là ?
— Non.
— Je le pensais bien.
— Qui pouvait vous faire supposer ?…
— Le Dieu excellent qui, deux fois déjà dans ma vie, a pris ses
précautions pour que je puisse tranquillement causer avec vous.
Sans attendre mon invitation, il franchit le seuil de la maison. Il y
avait dans le vestibule trois horloges, deux grands coffres
superposés, et quatre bois de fauteuil sans tenture ni rembourrage.
— Que c’est amusant ! dit Philippe Fabréjol.
— Nous logeons là-haut…
Mais discret, imaginant bien ce que pouvait être ce logement de
fortune, il dit aussitôt :
— Vous allez me recevoir ici, dans un de vos salons. Les
meubles n’y manquent pas.
Les fenêtres, ce matin, avaient été entr’ouvertes par les soins de
Chayère. Un soleil verdâtre qui, pour descendre jusqu’ici, devait
glisser sur les lierres noirs et les sombres lauriers du jardin,
s’allongeait à travers les pièces dont toutes les portes avaient été
enlevées pour laisser aux plus grands meubles un libre passage.
Malgré ce soleil, on respirait, comme dans les églises, l’odeur du
dallage humide et de la cire. Philippe Fabréjol me suivit dans ce qui
avait dû être la salle à manger. Autour d’un grand retable dont
rougissaient les dorures, et en face de lui à l’autre bout de la salle,
de vieilles glaces pendues aux murs et se reflétant l’une l’autre,
tachetées, troubles, étroites et hautes, ou toutes petites dans leur
cadre de bois sombre, multipliaient d’une façon confuse et infinie le
singulier désordre et l’encombrement de la pièce, sa pâle lumière, et
Philippe auprès de moi. Nous pûmes nous asseoir dans de grands
fauteuils, pas trop poussiéreux, venus d’Italie depuis quelque trois
cents ans et dont le cuir déchiré était retenu encore par de larges
clous rouillés et plats. S’égayant d’abord de tout regarder autour de
lui, mon compagnon me déclara qu’il y avait là quelques pièces
assez belles et qu’il irait voir ce Chayère à son magasin. Il m’en
demanda l’adresse. Je la lui donnai. Et nous nous attardions à parler
de ces meubles et de cet homme… Enfin, Philippe ne sut plus que
dire là-dessus. Je me tus aussi. Mais, presque aussitôt, je lui
redemandai :
— Vous allez donc partir ?…
Il répéta :
— Peut-être.
Et avec son regard grave de l’autre jour, quand nous étions assis
dans le pavillon :
— Ce n’est pas encore très sûr. Je crois que j’ai pris ce prétexte
pour ne point tarder davantage à vous rendre ma visite. J’avais peur
que vous ne retourniez à Lagarde et de ne plus vous revoir. Il faut
me pardonner.
— Je vous pardonne.
Et je me mis à rire, voulant lui prouver que je n’attachais à tout
cela qu’une petite importance. Mais mon rire était si vibrant qu’il
m’étonna moi-même. Ce n’était pas un rire de mondains
plaisanterie, mais un rire véritable, un rire de bonheur. Et ce rire ne
me semblait point soulevé par ces paroles : « Il faut me pardonner »,
mais par ces autres paroles dites à propos du prochain départ : « Ce
n’est pas encore tout à fait sûr… »
— Merci ! dit Philippe. Oui, voyez-vous, j’ai voulu venir, je suis
venu…
Il était un peu gêné, car il ne savait exprimer sa pensée qu’avec
franchise.
— L’autre jour, dit-il enfin, après avoir un peu cherché ses
paroles, j’ai aimé ma journée.
Il ne précisait pas quel était ce jour-là, et je pouvais, me sembla-
t-il, n’avoir pas très bien compris.
— Mais vous devez souvent aimer vos journées. Elles sont
heureuses.
Il reconnut :
— Sans doute.
Et, sérieux comme il savait l’être quand il réfléchissait
profondément :
— Cependant…
Soudain, ce fut comme l’autre matin, tandis que nous arrivions à
la porte de sa maison : la gêne tomba. Je cessai d’être contrainte et
lui d’être hésitant… et dans la seconde qui passa avant qu’il
poursuivît sa phrase, nous nous étions retrouvés.
— Que penseriez-vous de quelqu’un qui serait tout à fait heureux
simplement parce qu’il se porte bien et gagne beaucoup d’argent ?
— Vous n’êtes pas heureux seulement pour cela. Votre vie est
utile à beaucoup de gens que vous employez, à la France que vous
enrichissez. Et puis, cette campagne dont vous me parliez, ces
matins dans la montagne, ces grandes courses, ces soirs
lumineux… Vivre dans un beau pays et en goûter, comme vous le
faites, toute la beauté, c’est une raison d’être heureux qui ne me
paraît pas méprisable.
— C’est une des meilleures, mais autre chose encore est
nécessaire.
— Cette autre chose, vous devez l’avoir aussi, comme le reste.
J’entendais bien qu’il voulait parler de l’amour ; mais tandis que
j’imaginais, avec un peu de mélancolie, une femme très belle et qui
l’aimait passionnément, il me répondit :
— J’ai cru l’avoir, mais c’est le plus difficile et je m’étais trompé.
Il prononça ces derniers mots très simplement, très sincèrement
aussi, et il me parut que, si quelconques fussent-ils, il ne les aurait
pas dits à tout le monde. Il continua :
— On se trompe souvent… Je pensais même, — je crois que
j’avais le droit de penser, — on se trompe toujours. Mais je crois
aussi maintenant que je n’ai plus ce droit. Dans mon jugement sur
quelqu’un que je connais cependant bien peu, bien mal, je crois que
je ne me trompe pas… Vous me regardez… Vous m’avez compris.
Je ne cherche pas d’ailleurs à vous parler par sous-entendus. J’y
serais plus maladroit encore que dans ma franchise, et ce n’est pas
peu dire… Madame, ne faites pas ce petit geste… ne prenez pas ce
visage. Nous sommes amis depuis trois ans et l’autre jour je m’en
suis aperçu… Depuis l’autre jour…
Je me levai. Et comme si rien n’eût été dit depuis que nous
parlions de la vieille maison, de Chayère et de ses meubles :
— Maintenant, proposai-je, je vais vous montrer le jardin.
— Si vous voulez, accepta Philippe Fabréjol.
Et il ne s’irritait pas d’avoir été interrompu parce qu’il savait bien
que, malgré tout, il parlerait comme il avait décidé de le faire.
Descendant avec moi les longues marches plates, il admira les
fleurs de fer qui s’entrelaçaient à la rampe rouillée. Il regarda la
fontaine et le mascaron qui rejetait son eau limpide, et les autres
mascarons accrochés tout autour à la muraille humide attendant un
acheteur, inutiles et n’ayant dans leur bouche large ouverte que la
toile tissée par les araignées fileuses. Puis il reprit avec sa fermeté
tranquille :
— Depuis l’autre jour je n’ai véritablement pas cessé de penser à
vous. Et je me demande d’où vient cela, car je ne crois pas vous
aimer encore. Cependant, tout en parlant avec mon père de notre
prochain départ et de notre long séjour là-bas, j’ai senti une espèce
de tristesse, profonde et brusque. J’en ai cherché la raison, et j’ai
compris qu’il me serait pénible, je puis même dire douloureux, de ne
plus vous revoir. Pourquoi ?… Je n’en sais rien. Je ne vais pas me
mettre à vous parler de vos yeux, ni de votre grâce, ni de cette âme
frémissante que l’on sent passer dans les petits mots que vous dites.
Je ne tiens pas à vous faire de compliments. Je vous dis
simplement : cela est ainsi. Et je suis venu vous demander…
Je compris qu’il me regardait, je le sentis. Mais je baissai la tête,
et sans force pour l’interrompre, je contemplai fixement, en bordure
de la terre humide, les petits buis irréguliers.
— Je suis venu vous demander : dois-je partir tout de suite… dès
la fin de ce mois-ci ?… C’est tout… Je ne vous demande rien d’autre
que cette petite indication sur la conduite à suivre. Personnellement,
je puis retarder ce départ. Mon père me précéderait là-bas de six ou
huit semaines… Pendant ce temps, si vous êtes ici, nous nous
rencontrerions quelquefois… et si vous êtes à Lagarde, je puis très
souvent y avoir affaire… Alors je crois que nous deviendrions
vraiment deux amis… Plus tard, quand enfin je partirai, nous aurions
les lettres, qui sont un grand bonheur… Et puis… on ne sait pas…
Je reviendrai, et certes sans laisser cette fois passer trois années…
On ne sait pas… Il ne faut pas regarder trop loin… C’est aujourd’hui
qui nous fait du mal ou qui nous donne la joie… et c’est aujourd’hui
que je vous demande : à quelle date dois-je quitter la France ?…
Cela seulement, je ne demande que cela…
Il ne cherchait à prendre ni mon bras, ni ma main. Il parlait
lentement. Mais comme il s’était arrêté devant moi, il me fallut bien
lever la tête, et laissant une seconde mes yeux se prendre dans les
clairs yeux bleus, je fus une fois de plus tout envahie d’une douleur
qui m’épouvanta.
— Partez… il faut que vous partiez tout de suite.
— Oh ! non, dit en souriant Philippe Fabréjol. Ce n’est pas ainsi
que vous devez répondre. C’est très sérieux, puisque vous pouvez
me faire vraiment du mal. Il faut réfléchir. Vous réfléchirez huit jours
et puis vous me direz…
— Je vous dirai la même chose.
— Je n’en sais rien, déclara-t-il, et vous non plus.
Les murs étaient plus hauts, les lierres plus épais. Nous
tournions lentement dans la prison verte. Quand nous nous
retrouvâmes devant le large escalier, Philippe Fabréjol me tendit la
main.
— Au revoir, madame. Dans huit jours à cette même heure, si
elle vous convient, je vous attendrai au musée Calvet. Les salles en
sont désertes. Il vient seulement quelques étrangers, et d’ailleurs
vous n’aurez qu’une date à me dire.
Il serrait mes doigts, fortement et franchement, et sans pression
sournoise. A travers le couloir dallé je le reconduisis jusqu’à la porte
de la rue. Une fois encore, au fond des salles ouvertes, les glaces
troubles reflétèrent nos silhouettes rapprochées.
— Au revoir, dit-il encore.
Et il ne me rappela pas, en me quittant, ce rendez-vous qu’il me
donnait dans huit jours au musée Calvet. Il ne s’inquiéta même pas
que je lui eusse, là-dessus, donné aucune réponse : il savait bien
que rien de tout cela n’était nécessaire.

*
* *

Ce soir-là, quand Fabien rentra, quand il me parla, j’eus


l’impression que je ne le voyais pas devant moi, et je ne voyais pas
autour de moi la chambre et cet ordre agréable qu’il me plaisait d’y
entretenir. J’apercevais seulement, dans l’ombre des platanes,
dansante un peu parce qu’un petit souffle venait de se lever entre
les feuilles, une jeune fille qui était là, par un matin de juin, avec sa
robe à pastilles et son simple chapeau rond. Elle me regardait. Elle
avait connu le dangereux sourire de François Landargues ; elle
connaissait la décevante misère qui occupait seule la petite âme de
Fabien Gourdon ; et son regard était triste. Mais je me penchais vers
elle, je lui disais : l’amour est venu. Et je ne pouvais éprouver rien
d’autre que la grande joie dont elle se mettait à trembler.
Ce fut ainsi ce soir-là, et le lendemain, et encore une autre et une
autre journée. Cela ne fait qu’un petit nombre d’heures, mais il y tint
plus de vie que dans toute la somme de mes pauvres années.
J’examinais cette joie qui ne ressemblait à nulle autre, je pressais
mes deux mains sur elle, et je les écartais un peu pour la revoir de
nouveau. Je lui portais en offrande mes grands désirs et mes petites
blessures : et tout le sang de celles-ci, dont elle se nourrissait, la
faisait plus éclatante et plus forte.
Délaissant et détestant les coutumières besognes, je ne pouvais
plus m’occuper à rien qu’à me pencher sur le jardin où m’avait parlé
Philippe Fabréjol ; mais toute baignée que je fusse à ma fenêtre de
son ombre humide et verte, il m’était bientôt nécessaire que ce jardin
m’enfermât davantage ; il me fallait sentir sous mes pas la terre où
Philippe avait marché. Je descendais donc ; je regardais à la rampe
du vieil escalier les fleurs de fer qui lui avaient plu, et je touchais un
peu plus loin les buis lustrés où reposaient mes yeux cependant qu’il
disait : « Nous sommes amis depuis très longtemps… » Il disait
encore : « Nous revoir quelquefois… » Il disait aussi : « Il y aura les
lettres… et puis je reviendrai. » Et comme il l’avait conseillé, sans
vouloir regarder plus loin que tous ces bonheurs, je fermais les yeux
sur ce qui pouvait advenir de lui et de moi…

Et puis je rentrais dans la salle où, d’abord, nous nous étions


assis. Pour que le jour y fût le même, je poussais un peu les volets.
Je m’approchais de ces glaces dont l’eau trouble avait en même
temps reçu son image et la mienne, tout près, si près que mon
visage n’était qu’une forme confuse derrière laquelle une autre forme
me semblait apparaître. — Enfin il me fallait bien regagner notre petit
appartement ; mais que la présence de Fabien m’y était importune !
Je ne lui parlais plus de ses livres : je ne m’intéressais plus à ce
maladroit article que sur mes instances il commençait d’écrire.
J’aurais voulu qu’il sortît chaque matin comme il faisait auparavant.
J’aurais voulu qu’il ne me demandât pas, le soir, de l’accompagner
dans ses promenades. Je serais partie seule dans la campagne, au
bord du fleuve agité, seule !… avec autour de moi, en moi, cette
secrète présence…
Quelques jours… Cela dura quelques jours… Un bien petit
nombre d’heures. J’avais perdu tous les souvenirs de ma vie étroite
et réfléchie. Je ne pensais pas que le mal existât. Je ne redoutais
rien. J’attendais tout. Il n’y avait plus de détresse en moi, plus de
pitié, pas de remords. La joie, seulement, la joie !
Elle ne se précisait par aucune image. C’était une sorte de
frémissement merveilleux et confus. Je ne cessais plus de penser à
Philippe Fabréjol et de souhaiter sa présence, et cependant je ne
savais encore ce que je lui répondrais quand il me faudrait le revoir.
Il me parut un matin que j’y réfléchissais tout à coup. Je pensais :
« Plus que cinq jours, avant ce jeudi… Dans cinq jours… » Et alors
seulement un peu d’inquiétude commença de se mêler à mon
profond bonheur.
Il me devint nécessaire de préparer mon courage. Je voulus voir
ce musée Calvet où j’entrerais bientôt pour y rencontrer un jeune
homme que je connaissais peu, et pour lui dire, afin qu’il comprît
bien que je tenais à lui : « Ce n’est pas tout de suite que vous devez
partir… Nous nous reverrons comme vous le demandez. » Et j’y allai
le lendemain pendant que Fabien, s’intéressant chaque jour un peu
plus aux études que je lui avais conseillées, s’était rendu à la
bibliothèque pour y examiner certains ouvrages.
J’arrivai donc devant ce musée, j’en franchis la grille, et je dis au
gardien que j’étais déjà venue et qu’il pouvait me laisser seule. Dans
les salles matinales il n’y avait personne que le soleil couché sur les
parquets luisants et le peuple silencieux des visages peints et des
figures de pierre. Les uns et les autres m’intimidaient un peu. Et je
voulus d’abord essayer de les admirer afin qu’ils ne fussent pas trop
surpris de ma présence inattentive. Je les contemplai donc
longuement, mais sans bien les voir, et j’allai m’asseoir enfin dans la
troisième salle. Alors je ne sais quelles pensées auxquelles je ne
commandais pas commencèrent de m’absorber. Comme les formes
peintes et les formes de pierre qui m’entouraient, elles étaient là, je
voulais les regarder et je n’en distinguais aucune. A tout instant,
lassée de cette méditation confuse et que j’imaginais inutile, je
voulais me lever pour partir et cependant il m’était impossible de ne
pas rester à cette place.
Je m’y attardai si bien que le gardien tout à coup parut au seuil
de la porte. Il venait brusquement de se rappeler ma présence et
craignait que je ne fusse malade. J’étais très confuse. Je lui dis
qu’en effet j’éprouvais un peu de fatigue, et je m’en allai vite. Ma tête
était pesante de toutes les choses qui l’avaient traversée ; mais je ne
les connaissais pas, et je continuais de ne pas savoir ce qu’il me
faudrait dire à Philippe Fabréjol.
Il était tard quand je rentrai. Cependant, Fabien n’était pas là ;
mais je l’avais oublié ; son absence à cette heure ne m’étonna pas ;
et j’allai tout de suite me pencher à la fenêtre afin de revoir le jardin.
Alors, je tressaillis en apercevant mon mari qui s’y promenait
lentement. Jamais encore, je crois, il n’y était descendu. Et ma
surprise aussitôt se mêla d’irritation. Il observait les fleurs de la
rampe qui avaient plu à Philippe. Il contemplait l’eau coulant du
mascaron de pierre, il touchait distraitement les petits buis lustrés :
et il me paraissait que chacun de ses regards, chacun de ses
gestes, écartait de là les ombres heureuses. J’avais envie de lui
crier : « Va-t’en. Tu n’as pas le droit d’être dans ce jardin, tu n’en as
pas le droit. » Mais levant la tête, il m’aperçut, poussa une
exclamation presque joyeuse et se jeta dans la maison.
J’entendis dans l’escalier un pas précipité. Et voici que je me
rappelai la nuit où je l’avais entendu monter ainsi, la nuit où on l’avait
appelé près de François Landargues. Avais-je donc oublié cette nuit-
là ?… Il me semblait brusquement en retrouver le souvenir…, le
souvenir aussi du matin qui avait suivi et du premier soir où j’avais
revu Fabien, hagard et ruisselant après sa course sous l’orage. Et je
crois que d’abord, une seconde, quand il entra, je tournai vers lui ce
même visage où montait l’épouvante d’une interrogation qui ne
pouvait se formuler.
— Ah ! dit-il sans remarquer rien, te voilà. J’étais inquiet.
— De quoi donc ? Que pouvait-il m’arriver ?
— Je n’en sais rien… C’est que, vois-tu (et malgré qu’il fût encore
près de la porte, à l’autre bout de la pièce, j’avais l’impression
physique de sentir toute sa peine trembler et se presser contre mon
épaule), vois-tu, maintenant, je ne puis plus me passer de toi.

*
* *

Il avait parlé ainsi. J’avais cru sentir se réfugier contre moi cette
grande détresse. Et j’avais vu monter dans ses yeux une tendresse
implorante qui ne s’y était jamais montrée. Mais mon âme la
meilleure, qui se fût émue de tout cela, continuait d’être absente, et
ce qui avait pu naître durant ces quelques semaines n’existait plus à
côté de ce qui était né depuis ces quelques jours.
Je le croyais du moins… je le croyais… Mais pourquoi les
ombres heureuses s’en étaient-elles véritablement allées du jardin ?
Quand je descendis un peu plus tard, comme chaque jour, pour les y
chercher, je ne pus les retrouver. — Et je sentais maintenant à leur
place rôder cette ombre pesante qui s’attachait à Fabien et qu’il me
fallait traîner avec lui.
Notre promenade ce jour-là nous conduisit au delà du Rhône,
jusqu’à Villeneuve, si morne, si morte, avec ses rues où pousse
l’herbe et ses palais abandonnés. Au retour, comme nous étions las,
nous nous assîmes un instant au bord de la route. Le soir venait. Il
faisait presque froid. Autour de nous, parmi la campagne, et devant
nous dans Avignon, les lampes s’allumaient au fond des maisons.
Enveloppée dans mon manteau, tout près de Fabien qui se
serrait contre moi, je pensais à notre maison qui était là-bas, un peu
plus au nord, derrière les collines déjà bien sombres sur le ciel gris.
En ce moment Adélaïde avait, elle aussi, allumé la lampe et
Guicharde s’asseyait devant la table pour m’écrire une fois de plus :
« Quand allez-vous revenir ? » C’est la question que, depuis une
semaine, me posaient toutes ses lettres. Elle trouvait le temps long.
Elle s’ennuyait. Elle s’étonnait un peu. « Fabien, remarquait-elle, doit
avoir pris maintenant tout le repos nécessaire. » Pensant à elle, je
pensais à ce foyer dont elle était restée la gardienne. Y reviendrions-
nous jamais ? Pourrions-nous y revenir et recommencer de vivre là
comme nous y avions vécu après que Fabien m’aurait enfin parlé,
quand nous aurions regardé ensemble dans le passé la minute
effrayante, et dans l’avenir, tous les jours, tous les mois et les
longues années ?…

… Au moment même où je m’interrogeais ainsi, cet avenir et ce


passé ne prenaient plus soudain qu’une petite importance. Je les
distinguais à peine. Je les écartais de moi. Je rentrais à Lagarde ; j’y
retrouvais ma rue obscure, ma maison ennuyeuse, ma chambre
triste. Mais Philippe Fabréjol marchait dans la rue pour venir me
voir ; mais il entrait dans la maison ; mais je m’enfermais dans la
chambre pour lire ses lettres, pour y répondre ; et j’aimais la rue, la
chambre, et la maison…
Fabien soudain me toucha doucement le bras. Lui aussi regardait
autour de nous les lampes aux fenêtres et sans doute elles l’avaient,
lui aussi, ramené vers sa demeure.
— Je ne t’ai pas dit… Hier, j’ai écrit à Fardier.
Il n’avait pas prononcé ce nom depuis notre arrivée à Avignon. Je
tressaillis. Je le regardai. Mais l’ombre déjà faisait son visage
indistinct.
— Tu lui as écrit… pourquoi ?…
— Pour qu’il me dise.
— Quoi donc ?…
— Ce qui se passe là-bas.
Et s’abandonnant enfin, la tête contre mon épaule :
— Oh !… si tu savais !… si tu savais !…
Nous étions assis au bord de la route déserte et froide, comme
deux vagabonds. Notre maison était là-bas, où peut-être nous ne
retournerions plus, et toute la vie s’assombrissait autour de nous
comme cette campagne où les volets commençaient de se clore l’un
après l’autre sur les lumières entrevues. Nous étions comme deux
pauvres au bord de la route, seuls, tout seuls, avec ce souvenir,
avec cette hantise, avec cette douleur…
Et, pour la seconde fois sentant venir vers moi l’aveu redoutable,
pour la seconde fois aussi je pensais : enfin !… enfin !… J’attendais,
tremblant un peu, pressant l’une contre l’autre mes deux mains qui
devenaient froides. Et l’aidant, le soutenant déjà, je murmurais aussi
douloureusement, aussi secrètement que lui-même :
— Je sais… je sais…
Mais pas plus que le jour où il ne voulut pas assister au déjeuner
des Fabréjol, Fabien ne put aller jusqu’au bout de sa confidence. Un
moment après seulement, un long moment, ayant repris un peu de
calme, il calcula :
— Fardier me répondra par le retour du courrier. Mais la poste
est fort irrégulière en ce moment. Je ne pense pas recevoir sa lettre
avant jeudi.
Il soupira profondément. Et sans rien ajouter là-dessus, sans plus
vouloir qu’on en parlât :
— Rentrons, dit-il.
La nuit était venue. Il n’y avait pas de lune. Nous marchions
lentement, trébuchant sur les cailloux épars, au bord des ornières
profondes. C’est lui qui avait pris mon bras, et il s’y appuyait
quelquefois.

*
* *

Qu’avait-il demandé ? Qu’allait-on lui répondre ?


Que savait Fardier ? Mille imaginations m’envahissaient,
confuses et violentes. Je ne savais pas ce qui avait pu se passer à
Lagarde, autour de ce mort, depuis notre absence. Je ne savais pas
ce que Fabien souhaitait ou redoutait d’apprendre. Mais sur cette
route où il tenait mon bras, où nous trébuchions dans l’ombre, où
nous étions seuls, j’eus tout à coup la certitude qu’après avoir reçu
cette lettre, quoi qu’elle fût, Fabien me dirait tout, qu’il ne pourrait
pas ne pas tout me dire. La certitude, et non plus comme tout à
l’heure, et non plus comme l’autre matin où le courage lui manquait
pour m’accompagner à Pampérigouste, le vague et anxieux
pressentiment. La certitude ! Jeudi, ce serait pour jeudi. Et cette fois,
c’est bien, en vérité, que le moment était venu de préparer dans mon
cœur les paroles nécessaires. Déjà je les sentais venir, hésitantes à
la fois et tumultueuses, si simples et cependant presque sacrées,
puisqu’elles devaient déterminer l’avenir, tout l’avenir, le mien sans

You might also like