Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Strict Standards: Declaration of UserSettings::get() should be compatible with AbstractSettings::get($col_key1, $col_key2 = NULL, $col_key3 = NULL) in /home/corpus6/public_html/gelc/inc/users/model/_usersettings.class.php on line 208

Strict Standards: Declaration of UserSettings::set() should be compatible with AbstractSettings::set() in /home/corpus6/public_html/gelc/inc/users/model/_usersettings.class.php on line 208

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 304

Warning: Cannot modify header information - headers already sent by (output started at /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php:223) in /home/corpus6/public_html/gelc/inc/sessions/model/_session.class.php on line 222

Strict Standards: Declaration of BlogCache::get_option_list() should be compatible with DataObjectCache::get_option_list($default = 0, $allow_none = false, $method = 'get_name', $ignore_IDs = Array) in /home/corpus6/public_html/gelc/inc/collections/model/_blogcache.class.php on line 355

Strict Standards: Declaration of Blog::dbupdate() should be compatible with DataObject::dbupdate($auto_track_modification = true) in /home/corpus6/public_html/gelc/inc/collections/model/_blog.class.php on line 54

Strict Standards: Declaration of Blog::set() should be compatible with DataObject::set($parname, $parvalue, $make_null = false) in /home/corpus6/public_html/gelc/inc/collections/model/_blog.class.php on line 54

Strict Standards: Declaration of Skin::dbupdate() should be compatible with DataObject::dbupdate($auto_track_modification = true) in /home/corpus6/public_html/gelc/inc/skins/model/_skin.class.php on line 608

Strict Standards: Declaration of CollectionSettings::_load() should be compatible with AbstractSettings::_load($arg1 = NULL, $arg2 = NULL, $arg3 = NULL) in /home/corpus6/public_html/gelc/inc/collections/model/_collsettings.class.php on line 164

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 236

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 334

Strict Standards: Declaration of ItemListLight::query() should be compatible with Results::query($create_default_cols_if_needed = true, $append_limit = true, $append_order_by = true, $query_title = 'Results::Q...') in /home/corpus6/public_html/gelc/inc/items/model/_itemlistlight.class.php on line 48

Notice: Array to string conversion in /home/corpus6/public_html/gelc/inc/_core/_param.funcs.php on line 1199

Notice: Array to string conversion in /home/corpus6/public_html/gelc/inc/_core/_param.funcs.php on line 1199

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 334

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 334

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 223

Warning: Cannot modify header information - headers already sent by (output started at /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php:223) in /home/corpus6/public_html/gelc/inc/_core/_template.funcs.php on line 59
ELC 2010


Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 334
Sessão/Session 1: Análise Multidimensional / Multidimensional Analysis

by blogadmin


Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 334

Sessão/Session 1: Análise Multidimensional / Multidimensional Analysis

1.1. Metaphor and corpora: mapping dimensions of variation in metaphor use (Tony Berber Sardinha, PUC-SP)

Multi-Feature Multi-Dimensional Analysis, or simply Multi-Dimensional Analysis  (MDA) is a corpus-based methodology introduced by Douglas Biber (1985 et seq.) which has been widely utilized to address the issue of variation in language use. The main research goal of Multi-Dimensional Analysis is to characterize variation across registers, genres and sub-genres, through a method that includes corpus annotation, statistical factor analysis and interpretation of factors in terms of underlying communicative dimensions. To date, there have been several descriptions of such dimensions of variation for several languages, such as English, Korean, Spanish, and more recently Brazilian Portuguese. Traditionally, variables included in MDA have been mostly grammatical (morphological and syntactic); more recently, semantic variables (classification of words in major word classes in terms of their meaning) have also been taken into account. Nevertheless, none of those analyses included metaphor, which can be considered a drawback for two reasons. Firstly, the metaphor literature provides ample evidence that metaphor use is an important element in discourse, enabling speakers and writers to express a wide range of discourse features, most of which could not be appropriately properly conveyed without it. Secondly, as more individual genres and registers are described in the literature in terms of their metaphors, cumulative evidence suggests there is variation in several aspects of metaphor use among different text types. For instance, Cameron (2003), Krennmayr (2009) and Steen et al. (2010) all report variation in metaphor use in different registers, such as academic genres, conversation and classroom discourse. Despite the fact that metaphor use is generally acknowledged to vary from one language variety to another, metaphor variation has never been addressed directly in the literature. At the same time, ignoring metaphor may weaken the power of Multi-Dimensional Analysis as a framework for characterizing variation across different varieties, given that metaphor is a major component of language use. The aim of this paper is then to report on an analysis of variation in metaphor use across several registers of Brazilian Portuguese in the framework of Multi-Dimensional Analysis. In the research reported here, the following methodology was conducted: (1) A corpus of texts representing Brazilian Portuguese was collected, using the one-billion word Brazilian Corpus (Cepril, Fapesp) as a source. The corpus contains a wide range of written and spoken genres. (2) The corpus was tagged for both part of speech and syntax with the Palavras parser, a state of the art tagger for Portuguese. (3) The corpus was manually annotated for metaphor using an identification system based on features of both MIP (Metaphor Identification Procedure) and MIV (Metaphor Identification through Vehicles), two metaphor identification procedures suitable for identifying metaphor in texts. The annotation was word-based, so that each word was judged for metaphorical meaning and coded as either metaphorically used or not. (4) The manual analysis was complemented by automatic analysis carried out by the Metaphor Candidate Identifier, a software program designed to retrieve metaphors from corpora. (5) Each metaphorically used word was tagged a variable based on its features, including source domain, target domain, vehicle morphology, metaphor type, vehicle word class, vehicle probability level, among others. Other variables were added, such as for morphosyntax and metaphor density. Very low frequency variables were dropped. (6) The data was normalized and standardized, and a statistical factor analysis was run that extracted the significant factors. During extraction, a large number of solutions were experimented with. Factors were first extracted without rotation, using Principal Axis Factoring (PAF). After that, factors were rotated using Promax. A scree plot was used as a visual aid to help deciding the number of factors in the data. A three factor solution was found as the best one, because it was both interpretable and statistically sound. The factors were then interpreted functionally, which yielded dimensions of metaphor variation. These dimensions represent the way texts in Brazilian Portuguese vary in terms of metaphor use. The paper will present these dimensions and compare them to Biber’s original 1988 dimensions for English, since the dimensions identified here for Portuguese bear some resemblance to them. Problems with managing low frequency metaphor variables in an MDA methodology will also be addressed.

1.2. Multi-dimensional analysis of anglo-american popular music from 1940 to 2009 (Patrícia Bértoli-Dutra, UniToledo)

This paper presents the process and results of an investigation of linguistic features on the lyrics of songs originally recorded in English. In order to verify the existence of different dimensions of linguistic analysis, we considered lyrics as texts, observing how lexical items relate in morphological, syntactic and semantic terms when contrasted to their occurrence in general English. Although this research is classified as discourse analysis, our personal and professional motivation lies at the observation of the constant use of lyrics in the English as a Second and Foreign Language classroom practice due to its motivational and pedagogical power. Besides that, we also notice the lack of theoretical basis for a more supported use of song lyrics in the teaching of linguistic patterns, both lexically and grammatically. Popular music was selected for the study also due to its social nature and to the influence that words used in music causes to everyday language, at the same time as the music is influenced by everyday language. That is, by considering popular music as that produced for the masses and disseminated by the mass media we are also assuming its potential as source of linguistic knowledge (STARR; WATERMAN, 2007; MOORE, 2003; GRIFFITHS, 2003). The selected lyrics were investigated exclusively by their textual representation, that is, the lyrics apart from the sound. The main theoretical framework for the research is provided by Corpus Linguistics (BIBER, 1988; SINCLAIR, 1991; BERBER SARDINHA, 2004) which views the language from a probabilistic and functional perspective, assuming that words occur in a certain frequency and associate with other words which will define their function and use according to the context (FIRTH, 1957; HALLIDAY; HASAN, 1989; HALLIDAY, 1991; HALLIDAY; WEBSTER; 2002). From an early study of lexical convergence that showed the proximity of general English to song lyrics we detected the need for a new methodology that included other aspects of discourse. Thus we selected Biber’s model for a Multi-dimension analysis, which has also been used by other Brazilian researchers such as Pacheco de Oliveira (1997), Shergue (2003), Berber Sardinha (2000; 2004) and Kauffmann (2005). This approach is based on the assumption that the persistent co-occurrence of a group of linguistic features in different texts is evidence of a pattern of use in terms of function. According to Biber (1988, p.14), in linguistic terms “each dimension comprises an independent group of co-occurring features, and each co-occurrence pattern can be interpreted in functional terms”. Such dimensions will be empirically assessed quantitatively (how many there are) and relationally (how they relate to one another). Thus, the quantitative methodology is supported by the frequency count of lexical and situational features in order to establish the patterns of occurrences that enable language generalization. Adopting Biber’s model (1988), we collected a corpus with approximately 1,200,000 words from 6,290 song lyrics originally recorded in English by 32 different artists from 1940 to 2009. The corpus was tagged for its parts-of-speech features – using automatic annotation of text corpora Tree-Tagger, (BERBER SARDINHA, 2004, p. 114) – and for its semantic groupings – using a program developed by Berber Sardinha (2009) called Semantic Tagger, which is based on pre-existing ones: wsd.pl and SUMO. The most frequent features and lexical bundles (3-grams) in the corpus and in general English (Google N-Gram corpus) were considered as variables for the factor extraction at the SPSS program. Factor analysis reduces the huge number of variables, grouping them according to their co-occurrence. The 97 initial variables in our research were grouped into 13 grammar variables, 8 semantic variables, and 2 pattern variables (3-grams). Factor analysis resulted in three factors for each of those groups. From their interpretation seven different dimensions emerged. Each dimension shows the linguistic relations among the lyrics not as a binary opposition but as they distribute themselves across the texts revealing the proximity and differences of lyrics according to those specific features. The first dimension, argumentative versus informative, is characterized by texts presenting high occurrence of infinitive, gerund, imperative and modals, with positive loading, and high occurrence of nouns, with negative loading. This dimension is represented by the contrast of artists as Madonna and Aerosmith, of the decades of 2000 and 1980’s, and of Punk Pop and Surf rock. The second dimension, argumentative and pattern, is characterized by the same features as the first one, plus the occurrence of patterns of speech, with positive loading. Third dimension, interactive versus descriptive, is characterized by texts with high occurrence of personal and possessive pronouns (positive loading) and by high occurrence of adjectives and determiners (negative loading). Madonna and Pink Floyd represent this dimension in each of the edges/loadings, as well as the decades of 1940 and 1970, and rock’n’roll and progressive rock. The third dimension, past narratives versus immediate context, is characterized by the opposition between past narratives and immediate context, that is, the high occurrence of verbs in the past tenses versus the high occurrence of verbs in the present. The fifth dimension, personal acts, is characterized by the simultaneous presence of words that carry the semantic meanings of movement, act, people, time and object. The sixth dimension, emotion and society, is characterized by references to emotion and social matters. The seventh dimension, musical manifestation, is characterized by lyrics that refer to music. The analysis of song lyrics on the dimensional scale showed how singers and bands, musical styles and the decade of the recordings are closer or more distant to each other in linguistic terms. Nonetheless, we cannot say that a specific musical genre, artist or period does not represent either of the dimensions in any of their lyrics. We concluded that when considering the linguistic features of song lyrics, they are not always grouped the same way as the categorization imposed by the mass media, which have different goals other than offering a message to the listeners through a language that makes sense for them.

1.3. Um estudo multidimensional da variação linguística em redações de aprendizes de inglês (Denise Delegá-Lúcio, PUC-SP (PG))

A linguagem de aprendizes tem sido alvo de investigações constantes nas mais diversas áreas do ensino de línguas. Na Linguística de Corpus estes estudos são realizados principalmente pela subárea chamada de Linguística de Corpus de Aprendiz (LCA). Na LCA há muitos estudos sendo desenvolvidos ou já desenvolvidos relacionados à erros cometidos por alunos, além do subuso, sobreuso e evitamento de itens lexicogramaticais (Granger, 1998; Lorenz, 1999; Conde, 2002; Delegá-Lucio, 2006; Veirano Pinto, 2008), no entanto, há bem poucos estudos realizados sob a perspectiva da Análise Multidimensional e englobando os corpora de aprendizes de vários países ao mesmo tempo, de modo comparativo, sendo esta uma abordagem ainda pouco explorada em LCA.  Este artigo analisa redações produzidas por alunos avançados de inglês de dezessete países diferentes, além de redações produzidas por universitários nativos de língua inglesa. Para a realização deste estudo foram utilizados dezoito corpora. Dos dezoito corpora analisados, dezessete são de redações de aprendizes advindas do projeto ICLE (International Corpus of Learner English). O ICLE é um projeto pioneiro para coleta criteriosa de dados de aprendiz inciado por Sylvienne Granger da Universidade Católica de Louvain e que tem como objetivo permitir estudos bem delineados da linguagem de aprendizes de língua inglesa de vários países.  O décimo oitavo corpus é composto de redações de falantes nativos de inglês e pertence ao projeto LOCNESS (Louvain Corpus of Native English Essays), este projeto foi desenvolvido devido à necessidade de um corpus de falantes nativos de inglês que fosse comparável aos corpora do ICLE (Granger, 1998) e justamente por isso foi analisado em conjunto com as redações de aprendizes. Além da LCA, este estudo foi conduzido tendo ainda como base teorias ligadas à Linguística de Corpus (Berber Sardinha, 2004) e a metodologia empregada na Análise Multidimensional (Biber, 1988; Biber e Conrad, 2001; Conde, 2002; Kauffmann, 2005). Este artigo teve como objetivo principal comparar as escolhas lexicogramaticais feitas por aprendizes e falantes nativos de inglês em suas redações com vistas a investigar o quão próximas elas estão das características linguísticas pertencentes à linguagem oral ou escrita e à argumentativa. A Análise Multidimensional de Biber (1988) apresenta uma abordagem metodológica na qual os textos são analisados comparativa, estatística e qualitativamente, de modo empírico, levando em conta a diversidade de itens lexicogramaticais e como eles se correlacionam de acordo com sua variação no texto (Biber and Conrad, 2001). Esta metodologia propõe estudar a variação linguística de textos a partir de sete dimensões. Em função do escopo deste artigo, escolhemos proceder nossa investigação utilizando apenas duas destas dimensões, a saber, a Dimensão Um – Produção com interação versus produção informacional, que nos permite averiguar a variação de características da linguagem oral e escrita; e a Dimensão Quatro – Expressão explícita de argumentação, que possibilita verificar a presença ou não de características lingüísticas tipicamente argumentativas. Observando os resultados obtidos na Dimensão Um pudemos entender quais redações de quais aprendizes de um dado país foram escritas com mais ou menos características da linguagem oral. Já os resultados obtidos a partir da Dimensão Quatro nos forneceram indicações de como e quais redações foram escritas com características mais ou menos próximas das características linguísticas típicas de textos argumentativos. Os resultados mostraram que há influencia das características de linguagem oral em um grande número de redações de todos os países, bem como características da argumentação. As redações de alunos chineses estavam mais próximas da linguagem escrita enquanto que as dos alunos japoneses apresentaram bastante influência da linguagem oral. As redações de alunos brasileiros e suecos tenderam à neutralidade, apresentando traços tanto da linguagem oral quanto da escrita. No que diz respeito à argumentação, as redações de alunos turcos, nativos, japoneses e chineses se mostraram mais argumentativas enquanto que as de alunos alemães, brasileiros e espanhóis apresentaram menos características de argumentação. Os dados apontam para a possível necessidade de se ensinar com maior ênfase determinados itens lexicogramaticais característicos da linguagem escrita e argumentativa em detrimento de outros dependendo do país de origem destes alunos.

Sessão/Session 3: Tradução / Translation

by blogadmin

Sessão/Session 3: Tradução / Translation

3.1. Uso do corpus customizado na versão ao inglês de um texto técnico: contribuição do corpus de não nativos (Neyde Sati Ishioka, CUI-A/AE (PG))

A tradução técnica, pelo menos no Brasil, é concebida como todo tipo de tradução que não a literária e, exatamente por este caráter excludente, abrange a tradução de textos das mais diversas áreas, como por exemplo, tecnologia, engenharia, filosofia, medicina, além da tradução juramentada e da tradução para o cinema e a televisão. A tradução técnica tende, também em decorrência desta definição excludente, a ser o ofício da maior parte dos tradutores profissionais, e alguns destes também fornecem serviços de tradução da língua portuguesa à língua inglesa, uma demanda crescente do mercado, principalmente em relação aos artigos científicos da área médica. O objetivo deste trabalho é demonstrar a importância do uso do corpus customizado na versão ao inglês americano de um artigo científico do gênero textual “artigo original”, na área de gastroenterologia, como uma ferramenta de tradução poderosa, principalmente no caso de técnicas inovadoras pouco divulgadas na literatura internacional. Para a análise teórica da tradução técnica, foi utilizado o modelo de tradução comunicativa de Peter Newmark que considera o princípio do efeito equivalente com enfoque no leitor e a correlação entre tipologia textual e tipologia tradutória, além dos procedimentos técnicos da tradução comunicativa. A concepção de modelo de tradução enquanto visão sobre a forma pela qual uma tradução deve ser realizada foi baseada na análise de Heloísa Gonçalves Barbosa. Três diretrizes orientaram as escolhas tradutórias no processo de versão: privilegiar o leitor (médico ou estudante de medicina especialista da área), preencher os requisitos linguísticos, técnicos e terminológicos da publicação especializada para a qual o artigo foi encaminhado e considerar a convencionalidade, assim como o uso da terminologia da especialidade, de modo a evitar o estranhamento por parte do leitor nativo do inglês americano. Para fazer frente ao desafio terminológico e à questão da convencionalidade ou da naturalidade da redação no texto de chegada, optou-se pela compilação de três corpora customizados. O corpus customizado é um conjunto de textos da mesma área e subárea, com o mesmo registro e público-alvo do texto de partida, conforme proposto por Ana Julia Perrotti-Garcia. Primeiramente, foi compilado um corpus em inglês não nativo, denominado corpus EMR-JP, composto de artigos e abstracts em inglês americano ou britânico sobre mucosectomia endoscópica ou “endoscopic mucosal resection” (EMR), escritos por autores de instituições japonesas que compunham grande parte lista de referências do texto de partida. Em seguida, foi compilado um corpus de autores ocidentais, o corpus EMR-EN, sobre o mesmo tema e formado por artigos e abstracts em inglês em que ao menos um dos autores tivesse vínculo com instituições de países ocidentais, pois, em meados de 2008, não havia na literatura médica internacional tantos artigos publicados e de livre acesso sobre as recentes técnicas apresentadas. Devido à dificuldade de compilar textos autênticos na língua inglesa na variante americana sobre mucosectomia endoscópica, também foi compilado e utilizado outro corpus de artigos originalmente escritos em inglês por autores vinculados a instituições nos Estados Unidos sobre “câncer de cárdia”, tema relacionado à ressecção, denominado corpus CA EN-US, para auxiliar na pesquisa dos colocados, das questões de ortografia e de gramática. Para verificar a representatividade dos três corpora em inglês, o número de types (palavras não repetidas) dos três corpora customizados foi analisado em relação ao número de types do texto de partida, por meio do recurso WordList do WordSmith Tools (versão 5.0), que possibilitou veificar a variedade vocabular ou riqueza lexical dos três corpora customizados coletados. Para encontrar o colocado mais provável e, por extensão, o mais usado na língua de chegada, e não aquele possível de ocorrer, foi utilizado o concordanceador Concord, do  WordSmith Tools. Para fins deste estudo, foram selecionadas cinco buscas para mostrar algumas das estratégias utilizadas e a versatilidade da utilidade do corpus customizado, o qual também possibilitou resolver outras dúvidas e fundamentou várias escolhas durante o trabalho de versão. A utilização dos corpora customizados compilados conforme descrito anteriormente permitiu: (1) verificar que não há intercambialidade das expressões terminológicas “endoscopic mucosectomy” e “endoscopic mucosal resection”, (2) identificar o equivalente em inglês de uma categoria da classificação anatomopatológica, o “carcinoma anel de sinete”, (3) a flexão verbal usada com o substantivo “data” em artigos científicos da subárea do texto de partida, (4) identificar o equivalente e a descrição de uma técnica inovadora, a “strip biopsy”, ainda pouco divulgada na literatura médica internacional e (5) verificar uma das finalidades do uso da voz passiva em textos técnicos. O corpus de não nativos foi essencial para a tradução das técnicas inovadoras, não presentes nos corpora EMR-EN e CA-EN US. O corpus customizado é uma poderosa ferramenta nas mãos do tradutor que sabe ser intuitivo e criativo e que também possui paciência e curiosidade para explorar ao máximo todas as suas possibilidades. A sua utilização não isenta o tradutor de recorrer a outras fontes de pesquisa, como dicionários monolíngues em inglês de especialidade ou não.  No caso do tradutor de texto técnico não especialista, dicionários e glossários da área mono e bilingues são essenciais, bem como vários recursos disponíveis na Internet para compreender o máximo possível o assunto do texto de partida, além da revisão técnica e linguística da versão final do texto traduzido.

3.2. Colocações e colocações especializadas estendidas em documentos jurídicos e juramentados: uma investigação à luz da Linguística de Corpus (Adriane Orenha-Ottaiano, UNESP -IBILCE)

A presente investigação, resultado de nossa tese de doutorado, teve, como uma das motivações iniciais, nossa experiência como professora de línguas e tradutora de textos jurídicos e especializados, a qual nos fez observar que os textos em questão possuíam combinações de palavras (colocações) e de termos (colocações especializadas) na língua-fonte que se mostravam bastante complexos na tradução para a língua-alvo. Outra motivação que delineia este estudo reside no fato de a tradução juramentada (TJ) ser considerada de grande relevância nas relações comerciais, sociais e jurídicas entre as nações. Nesse sentido, decidimos realizar uma pesquisa cujo propósito era investigar os termos, as colocações especializadas e as colocações especializadas estendidas presentes em contratos sociais e estatutos sociais que representam os corpora de pesquisa compilados. De modo bem sucinto, colocações são combinações lexicais recorrentes e de coocorrência arbitrária. Essa definição se aplica tanto a colocações da língua geral quanto a especializadas. Como, neste trabalho, investigamos colocações especializadas, é importante mencionar que, diferentemente das colocações da língua geral, que tem como núcleo uma unidade lexical não especializada, as especializadas têm como base uma unidade terminológica ou termo. Nesta investigação, também observamos as semelhanças e diferenças nos corpora de traduções jurídicas e juramentadas, no que concerne ao uso desses termos e padrões lexicais, assim como apontamos aqueles que são mais frequentemente empregados em documentos do tipo contrato social e estatuto social. A investigação baseia-se na abordagem interdisciplinar dos Estudos da Tradução Baseados em Corpus, da Linguística de Corpus, e da Fraseologia. A Terminologia, por meio de seus pressupostos teóricos, também traz sua contribuição para a pesquisa, assim como os trabalhos sobre a TJ. Para realizar este estudo, compilamos um corpus de estudo (CE1) constituído por contratos sociais e estatutos sociais traduzidos no modo juramentado, nas direções tradutórias inglêsàportuguês e portuguêsàinglês, extraídos de Livros de Registro de Traduções, pertencentes a tradutores juramentados credenciados pela Junta Comercial de dois Estados brasileiros; e um corpus de estudo (CE2) formado por documentos de mesma natureza traduzidos sem o processo de juramentação, nas mesmas direções tradutórias. Além destes corpora, construímos dois corpora comparáveis, formados pelos referidos documentos originalmente escritos em português e em inglês. A extração dos termos e dos padrões fraseológicos (colocações especializadas e colocações especializadas estendidas) foi favorecida por meio da observação empírica dos documentos que compõem os corpora, assim como potencializada pelo uso da ferramenta computacional WordSmith Tools (SCOTT, 2004), versão 4.0. Os resultados desta trabalho mostraram várias semelhanças, no tocante aos termos empregados em documentos traduzidos no modo juramentado (TTJs) em relação àqueles que não foram submetidos ao processo de juramentação (TTs): mais de 60% dos termos presentes em TTJs também ocorrem nos TTs. Também, foi possível verificar uma série de aspectos semânticos, lexicais e estruturais em comum entre contratos sociais e estatutos sociais. A esse respeito, os dados apontaram que aproximadamente 80% das palavras de maior chavicidade presentes em contratos sociais também constam em documentos do tipo estatuto social. No que tange às colocações especializadas, verificamos que colocações a partir da base shares não são frequentes nos textos traduzidos no modo juramentado para o inglês analisados. Nesses textos, as colocações com a base quotas em inglês mostram-se mais frequentes, podendo indicar que a TJ possui uma linguagem própria, haja vista que o termo quotas não existe em inglês. De acordo com a pesquisa, é possível notar que a tradução de colocações especializadas e, principalmente, de colocações especializadas estendidas pode ser considerada um desafio para tradutores tanto jurídicos quanto públicos, uma vez que padrões lexicais recorrentes estão intrinsecamente relacionados a aspectos culturais e sujeitos a sistemas jurídicos distintos. Dessa maneira, a inclusão de tais padrões em uma obra termino-fraseográfica pode ser de grande valia e praticidade para o profissional em questão. Com esse propósito, compilamos um glossário bilíngue, no qual constam as colocações especializadas levantadas a partir de um dos termos mais frequentes nesta investigação: shares. Em razão de o glossário ser bilíngue, estão incluídas, também, as colocações correspondentes em português a partir da base “ações” e as duas grafias do termo: “quotas” e “cotas”.

 

Sessão/Session 4: TV e cinema / TV and movies

by blogadmin

Sessão/Session 4: TV e cinema / TV and movies

4.1. Interação no cinema de Hollywood: uma perspectiva diacrônica baseada em corpus (Marcia Veirano Pinto, PUC-SP (PG))

O objetivo da pesquisa relatada aqui é contribuir para as aplicações pedagógicas de filmes em sala de aula de Inglês como Língua Estrangeira (doravante ILE). Mais especificamente, o trabalho visa a descobrir quais filmes, dentre as dezesseis comédias e dezesseis dramas selecionados para este estudo, apresentam mais características interacionais. Os filmes de Hollywood foram eleitos para este trabalho porque apesar de suas aplicações pedagógicas na sala de aula de ILE serem uma tradição e possuírem extensa literatura (COOPER et al., 1991; STEMPLESKI & ARCARIO, 1992; BRADDOCK, 1996; BRINTON, 2001; KING, 2002), há escassez de trabalhos que investigaram detalhadamente sua linguagem e validade como fonte de material para o ensino e aprendizagem de conversação. Até a presente data, apenas Forchini (2009) buscou estabelecer, empregando a metodologia da Análise Multidimensional de Biber (1985 et seq.), o grau de similaridade e diferença entre a linguagem espontânea e a linguagem dos filmes hollywoodianos. O primeiro passo para atingir o objetivo supracitado foi a compilação de um corpus de 359.498 itens, contendo a transcrição de trinta e dois filmes produzidos entre as décadas de 1930 e 2000. Esse corpus foi analisado por meio da metodologia conhecida como análise com classificação Multidimensional (BIBER, 1985 et seq.), que pressupõe a caracterização do corpus de acordo com os traços linguísticos propostos por Biber (1988). Dessa forma, o segundo passo da pesquisa foi a elaboração de um script em linguagem Shell (Berber Sardinha, 2009), que emulou o etiquetador produzido por ele. Como o objetivo específico do trabalho era descobrir quais dentre os filmes selecionados apresentam mais características interacionais, as etiquetas reproduzidas no script correspondem aos traços linguísticos propostos por Biber apenas para a Dimensão 1, ou seja, a Dimensão que melhor representa o contraste entre a produção com interação (oral) e a produção informacional (escrita). O terceiro passo consistiu do processamento estatístico das frequências dos traços linguísticos  por meio do programa computacional PASW Statistics 18. Esse passo é necessário para que as frequências extraídas tenham seus valores convertidos para uma escala única e para que cada um dos filmes receba os escores que determinam sua distribuição dentro dessa escala. O quarto e último passo da análise tratou da elaboração da escala em si, na qual o escore mais alto corresponde à produção com interação (oral) e o escore mais baixo à produção informacional (escrita). Dessa forma, ao se distribuirem os filmes escore ao longo da escala mencionada, é possível verificar a variação relativa às características interacionais e informacionais de sua linguagem. O resultado geral corrobora o resultado obtido por Biber (1988), pois o escore médio dos trinta e dois filmes é 0,03, isto é, se coloca entre os escores obtidos por ele para ficção romântica (4,3), ficção geral (-0,8), ficção mistério (-0,2) e ficção aventura (0). Esse escore médio demonstra o que se esperaria: obras de ficção que foram escritas para serem faladas apresentam um equilíbrio entre traços linguísticos característicos tanto da produção com interação (oral) quanto da produção informacional (escrita). A análise apresenta-se mais interessante do ponto de vista de sua validade como fonte de material para o ensino de conversação na sala de aula de ILE à medida em que se analisam os escores para os gêneros comédia e drama em separado e para cada um dos filmes individualmente. Na Dimensão 1 proposta por Biber (1988) o escore médio mais alto, correspondente a produção com interação (conversas ao telefone), é 35,3 e o escore médio mais baixo, correspondente a produção informacional (documentos oficiais), é -18,1. Sendo o escore médio entre as comédias -5,93 e o escore médio entre os dramas 2,7, pode-se dizer que os dramas têm potencialmente mais características interacionais do que as comédias. Além disso, fez-se uma análise filme a filme a fim de identificar os filmes com maior preponderância de linguagem interacional e/ou informacional e os traços linguísticos mais salientes em cada um. O filme cujos diálogos obtiveram o escore mais alto (42,86 – o drama Doze Homens uma Sentença), por exemplo, coloca-se acima do escore médio localizado na extremidade do polo produção com interação (35,3 – conversas ao telefone). Já o que apresenta o escore mais baixo (-23,75 – o drama Filadélfia) está mais próximo do escore médio que se coloca na extremidade do polo produção informacional (-18,1 – documentos oficiais). Quinze dos trinta e dois filmes se encontram na faixa -10 a 10, sendo que neste caso onze deles são comédias e apenas 4 são dramas. A conclusão é a de que caso o objetivo seja apresentar material audiovisual com características mais interacionais, então poderia se escolher o filme Doze Homens uma Sentença, por exemplo, por causa de seu escore mais próximo do polo interacional da Dimensão 1. Ao passo que se intenção fosse mostrar linguagem falada com características mais informacionais, então seria mais condizente escolher o drama Filadélfia ou a comédia Primavera para Hitler, cujos escores se aproximam mais do polo informacional. No entanto, como a distribuição das comédias e dramas apresenta variação ao longo da escala, a utilização dos filmes hollywoodianos de modo informado em sala de aula depende de um mapeamento extenso dos traços linguísticos presentes nos diálogos de cada um individualmente.

4.2. High frequency items in a sitcom corpus of spoken language. Differences between pseudo and real conversation (Barbara Malveira Orfano, UFSJ)

This is a corpus-based comparative study of spoken language used in the media genre of sitcoms. We compare the sitcom Friends to two natural spoken corpora: the Limerick corpus of Irish English (LCIE hereafter) and the Santa Barbara Corpus of Spoken Language (SBC hereafter). The main aim of this study is to determine how similar the sitcom dialogues are to the dialogues in the two natural spoken corpora used in this research. Fundamental to the analysis is the backdrop of research within the field of corpus linguistics, discourse analysis, and pragmatics. Analytical tools from the area of corpus linguistics will be employed, as well as insights from the areas of pragmatics, discourse analysis (DA) and conversation analysis (CA).  As pointed out by O’Keeffe (2003:3), such an eclectic approach optimises the analysis by providing many instruments with which to cut through the data. The study of language and the media has focused mainly on the written genres of newspapers and television news reports. Biber et al. (1999) identify the language of newspapers as one of the four main registers of the English language. Extremely relevant and, indeed, very influential for this study is research carried out by O’Keeffe (2003, 2006 and 2009). In her corpus-based study on radio phone-in, she observes the creation of intimate relationships in and through media discourse. The relationship built between participants was examined by analysing specific spoken interactions between the presenter and the programme’s callers. She argues that employing corpus linguistic methods to investigate systematicity in lexico-grammatical patterns is very fruitful. Quaglio (2009) concentrates on the study of situation comedy discourse also using corpus linguistics methods. According to Quaglio (ibid.), there are no linguistic studies comparing the language of sitcoms with the grammatical characteristics of face-to-face conversation. His study compares the language of the sitcom, Friends, to natural conversation focusing on the linguistic features that make scripted dialogue ‘sound’ natural. The present paper aims to determine how the lexis and the lexical patterns in the dialogues of the sitcom Friends are influenced by the topics present in the show, and particular important in this research, the function of these linguistic features in the overall narrative of the programme. The influences which a broader participation framework, represented by the audience of the show, might have on the discourse of a sitcom will be examined by comparing and analyzing the findings, using both quantitative (corpus-based analytical tools) and qualitative approaches (Conversation Analysis and Discourse Analysis). First, we generated frequency lists and identified the most frequent words in Friends. Secondly, using LCIE (The Limerick Corpus of Irish English) and SBC (Santa Barbara Corpus of Spoken Language) as a reference corpora, we based our analysis on a key word list to double check the importance of these words in Friends. At a preliminary level, the key word list showed that the words: you, I, what, oh, just and this are key words in the sitcom corpus. In order to have a better understanding of these words, we also examined the most common clusters occurring with each word followed by a close examination of concordance lines and samples from the data. With the aid of corpus linguistics tools (keyword list, cluster lists, and concordance lines), this study identifies the linguistic items that characterise the sitcom Friends. Focusing on the most common patterns found in the show, we analysed the features that prove to be instrumental in the discourse of the show and compared them with the reference corpora.  The analysis shows that some patterns appear to be specific to the media genre instead of characterising casual conversation between real friends. This claim is supported by the presence of numerous instances of arguments, which demonstrates the dramatic characteristic of the sitcom. Other examples which we have noted include the high frequency of response tokens such as Oh my God and I can’t believe. When comparing these findings with the reference corpora, it can also be said that in Friends the frequency of these expressions are more exaggerated than in real conversation. The results indicate that some items belong more to the media genre than to natural conversation. These linguistic features that correspond to the media discourse differentiate Friends from real conversation bringing interesting insights to the ongoing discussion around corpus-based studies on media discourse.

 

Sessão/Session 6: Literatura / Literature

by blogadmin

Sessão/Session 6: Literatura / Literature

6.1. Medidas de complexidade textual entre traduções brasileiras e originais de literatura inglesa: um estudo piloto baseado em corpus (Bianca Pasqualini, Maria José Bocorny Finatto e Aline Evers, UFRGS (PG)/ UFRGS)

Este estudo tem o objetivo de colher indicativos para proceder, em escala maior, à investigação da seguinte hipótese: há determinadas traduções da literatura inglesa produzidas no Brasil que tendem a gerar textos mais complexos do que os textos-fonte. Essa complexidade pode ser associada às seguintes características: a) amplitude e variedade do vocabulário empregado; b) complexidade do texto como um todo, constituída por diferentes recursos textuais e discursivos. A partir dessa hipótese, empreendemos um estudo quantitativo e qualitativo sobre padrões de vocabulário e de complexidade textual, tomando como corpus de estudo um conjunto de cinco contos de Edgar Allan Poe traduzidos para o português brasileiro. Esse tipo de estudo, associado ao reconhecimento de vocabulário em textos, especialmente com textos literários, não é novo. Existem diversos estudos disponíveis sobre a obra e as traduções de Poe e pelo menos desde 1800, quando se contestou a autoria de alguns textos religiosos, temos notícia de observações sobre o conjunto e os tipos de palavras utilizados em um texto para confirmar ou refutar autoria. Do mesmo modo, os estudos de Literatura Comparada também nos legaram resultados ao contrastar textos de diferentes autores que, inspirados por temáticas semelhantes, produziram obras consideradas pertencentes a uma mesma escola ou tradição da Literatura em função de tipos de escrita e de vocabulário exibidos. Entretanto, o tipo de observação de vocabulário a que nos propusemos, que utiliza métodos estatísticos sistemáticos, é relativamente recente, sobretudo no âmbito dos estudos literários. São considerados pioneiros trabalhos dos anos 1940 que envolveram observação estatística de vocabulário de textos literários e que geraram a obra The statistical study of literary vocabulary. A partir de 1990, com o advento do computador de pequeno porte acessível a muitas pessoas, esse tipo de pesquisa de fundo estatístico adquiriu um desenvolvimento sem precedentes, sobretudo na área de investigação que envolveu o estudo de originais e respectivas traduções feito com corpora e com apoio de métodos e de concepções teóricas da Linguística de Corpus. A partir de 1993, os trabalhos de Mona Baker, por exemplo, renderam todo um corpo de reflexões e a ideia de que haveria universais para o comportamento linguístico e textual da tradução, independentemente de pares de línguas e tipos de textos envolvidos. Entre esses universais estaria o fenômeno da explicitação, segundo o que um texto traduzido teria maior teor de informação do que seu texto-fonte, pois o tradutor tenderia a explicitar informação implícita entre texto-fonte e texto-alvo. Considerando todo esse corpo de trabalhos que nos precedem e avanços atuais da área de processamento da linguagem natural nos anos 2000, examinamos conjuntos de textos-fonte e suas respectivas traduções a partir de duas medidas, uma bem específica, a riqueza lexical, e outra bem mais ampla, aqui chamada simplesmente de índice de complexidade. A riqueza lexical correspondeu à proporção simples entre o número de palavras diferentes e o número total de palavras do texto, verificada entre originais e traduções. Para o índice de complexidade textual dos contos, utilizamos as ferramentas Coh-Metrix e Coh-Metrix-Port, que calculam índices que avaliam a coesão, a coerência e a dificuldade de compreensão de um texto em diferentes níveis de análise linguística. Esses níveis incluem os níveis lexical, sintático, discursivo e conceitual, observando fatores tais como número de sentenças, número de palavras por sentença, correferências, anáforas, presença de conectores e de itens com ambiguidade semântica e número de pronomes por sintagma. Essas ferramentas, especialmente desenhadas para lidar com textos como unidades de análise, foram desenvolvidas para o inglês na Universidade de Memphis e adaptadas para o português brasileiro pelo grupo NILC-USP. Como a unidade de observação, nesse tipo de ferramenta, é um texto em seu todo e não um corpus global de grandes dimensões que reúne vários textos, tomamos como material de estudo apenas uma pequena amostra de contos de Poe sem a preocupação de que ela se aproximasse do todo da produção do autor nesse gênero. Além disso, a ferramenta Coh-Metrix para o inglês suporta processar, por cada vez, textos que alcancem a dimensão máxima de apenas 15 mil caracteres, o que exige processamentos fracionados de um mesmo texto. Por isso, demos preferência para os textos mais curtos do autor. Como elementos de contraste para o estudo, recorremos a duas amostras de textos: a) um conjunto de cinco textos literários brasileiros traduzidos para o inglês britânico no gênero conto, de escritores como Humberto de Campos e Machado de Assis; b) uma amostra de cinco artigos científicos da área de Pediatria escritos originalmente em português e traduzidos para o inglês, publicados em 2002 e 2008, cujo número de palavras por texto tem em média cinco mil palavras. Os resultados do trabalho mostraram que as traduções brasileiras de Poe tenderam a produzir textos mais complexos do que seus textos-fonte no que tange às duas medidas analisadas. Além disso, vimos que tanto as traduções da literatura brasileira para o inglês britânico quanto as traduções de textos científicos brasileiros para um padrão de inglês internacional norte-americano tenderam a fazer percurso inverso: o texto tornou-se menos complexo em função de diferentes fatores. O estudo realizado, naturalmente, não é amplo o suficiente, mas contribui à medida que ultrapassa, pelo menos no âmbito da Linguística de Corpus, a análise centrada em frequência de palavras, chavicididade, combinatórias recorrentes e medida da riqueza lexical. Foram utilizados, neste estudo-piloto, recursos que abarcam um considerável grupo de fatores associado à complexidade textual. Os indicativos e ponderações obtidos serão aproveitados para uma pesquisa que inclui a totalidade da obra de contos de Poe traduzida no Brasil, considerando-se inclusive um mesmo original traduzido por tradutores diferentes. Esse trabalho visa discutir padrões para uma tradução da obra de Poe para o português do Brasil que estejam associados a um texto de boa inteligibilidade para leitores adolescentes do ensino médio.

6.2. Palavras-chave e hapax legomena: aliados na análise literária? (Lourdes Bernardes Gonçalves, UFC)

 

A Linguística de Corpus representa um instrumento poderoso na análise de textos literários, especialmente quando aliada a abordagens não-computacionais, ao trazer à luz interpretações, detalhes temáticos ou palavras criticamente importantes no texto, informações que poderiam passar despercebidas em outros tipos de análise. Ao permitir ao pesquisador processar uma grande quantidade de informação, a Linguística de Corpus fornece uma lupa ideal para se observar justamente esses dados, que não podem ser notados “a olho nu”. É o caso da observação das hapax legomena, isto é, palavras que só aparecem uma vez no texto e que são, por isso, muito difíceis de detectar num escrutínio manual. Estas foram o objeto de nosso trabalho, que apresentou a determinação de palavras-chave e a observação das hapax em dois contos australianos, como elementos definidores de linhas temáticas. A determinação das palavras-chave de um conto pode dar origem a agrupamentos semânticos, que definem as áreas temáticas da obra. A obtenção dessas palavras ocorre de maneira quantitativa quando se usa uma ferramenta que compare o percentual de freqüência com que uma determinada palavra aparece no texto estudado (Corpus de Estudo), comparado ao percentual de freqüência da mesma palavra em um outro texto, ou textos (Corpus de Referência). De acordo com o Corpus de Referência escolhido, as palavras-chave podem diferir um pouco, e é função do pesquisador compilar um Corpus de Referência que ressalte as características que se quer pesquisar. Por exemplo, no caso deste estudo, como se quer estudar contos em termos de suas áreas temáticas, as características típicas de todos os contos podem ser anuladas. Assim, os dois contos objetos de estudo serão comparados com uma coleção de outros contos.  O programa WordSmith Tools (SCOTT, 1998) possui tal ferramenta, KeyWords, e foi utilizado aqui para a obtenção de palavras-chave de dois contos analisados. As palavras hapax legomena, consideradas na sua totalidade, correspondem a mais de metade das palavras diferente (tokens) de qualquer texto. Formam, portanto, uma legião importante de palavras que, se passíveis de serem agrupadas em áreas temáticas, podem contribuir significativamente para reforçar um tema do texto. Essa será a hipótese deste trabalho. O objetivo aqui, portanto, foi analisar dois contos australianos em termos de seus temas, utilizando o programa WordSmith Tools (SCOTT, 1998). Mais especificamente, visou-se determinar as áreas temáticas a partir das palavras-chave e mostrar qual a contribuição – se houve alguma – das hapax como elementos que reforçariam determinadas áreas temáticas definidas pelas palavras-chave.  Os contos que compuseram os dois Corpora de Estudo foram dois contos australianos, a saber, “Being Kind to Titina”, de Patrick White (1964), e “Lady Weare and the Bodhisattva”, de Kylie Tennant (1969). Os corpora de Referência também foram dois, um de inglês britânico e outro de inglês australiano, utilizados em momentos diferentes da pesquisa. O primeiro passo metodológico foi compilar os dois corpora de referência, ambos compostos de contos; o primeiro, britânico, formado por 52 contos, de D. H.Lawrence, Virginia Woolf e Katherine Mansfield; o segundo, composto de 29 contos australianos do século XX. No estudo de cada conto, foi feita uma lista de palavras-chave, inicialmente com o Corpus de Referência britânico e essas palavras-chaves foram agrupadas por tema. A seguir, a lista de hapax, obtida a partir da ferramenta WordList, do programa WordSmith Tools foi também examinada para se verificar se essas palavras poderiam ser agrupadas em grupos temáticos. O último passo foi comparar os grupos de palavras-chave obtidas com relação ao segundo Corpus de Referência, para se determinar se o uso de um vocabulário tipicamente australiano teria afetado os resultados da pesquisa. No caso do primeiro conto, “Being Kind to Titina”, nossa conclusão foi que os hapax legomena são relevantes na criação de universos temáticos que reforçam as áreas temáticas definidas pelas palavras-chave do conto e, o que é mais curioso, podem fornecer uma tessitura de palavras de uma mesma área temática que leva o leitor, de forma velada e quase inconsciente, a mergulhar num ambiente de sensações cuja origem ele próprio não pode precisar.  Foi o caso da área temática de emoções, em que se percebeu um acréscimo substancial ao grupo de palavras já definido com relação ao Corpus de Referência. Uma surpresa se nos deparou, ao analisarmos o segundo conto, “Lady Weare and the Bodhisattva”, na lista das palavras hapax. Encontrarmos uma grande ocorrência de palavras que remetem à área semântica de emoções e sentimentos, área esta não contemplada na observação da lista de palavras-chave. O alto número de palavras da área de emoções/sentimentos definida a partir das hapax, corresponde a 12,49% de todas as palavras diferentes (types) do texto, o que é extremamente significativo, na medida em que impõe ao leitor uma impressão de tal área semântica. E o fato de que as palavras são hapax, faz com que essa impressão se realize de maneira sutil.

6.3.Corpora e operações enunciativas: um estudo sobre as adversativas do português brasileiro (Marion Celli USP (PG))

Culioli (2000) defende o estudo das formas textuais como o ponto de partida para a descrição das propriedades das línguas que, em sua diversidade e heterogeneidade, atualizam verbalmente a atividade de linguagem. Assim, segundo o linguista, somente a partir da análise dos textos é possível observar a rede de fenômenos e funcionamentos que articulam as operações enunciativas de uma dada língua. Sua abordagem, porém, ainda é tradicional do ponto de vista desse estudo das formas textuais, uma vez que, assim como os linguistas tradicionais, manipula enunciados escolhidos aleatória e intuitivamente, o que restringe e limita o alcance das hipóteses.  No contexto de nosso mestrado, cujo principal objetivo é descrever semântica e enunciativamente cinco marcas adversativas do português brasileiro (PB) – MAS, PORÉM, CONTUDO, TODAVIA e ENTRETANTO –, associamos à teoria culioliana a abordagem da Linguística de Corpus, que nos permite explorar a dinâmica enunciativa dessas unidades através de evidências empíricas extraídas por computador (Berber Sardinha, 2004). Para este trabalho, utilizamos um corpus monolíngue de 520.325 palavras, constituído por cinco obras da literatura brasileira do século XX – Sagarana, de Guimarães Rosa; A República dos Sonhos, de Nélida Piñon; A paixão segundo G.H., de Clarice Lispector; Onde andará Dulce Veiga, de Caio Fernando Abreu; e Benjamim, de Chico Buarque. Na primeira fase da pesquisa, utilizamos para o levantamento quantitativo dos dados as ferramentas Concord (Concordância) e Wordlist (Lista de palavras) do programa computacional WordSmith Tools (Scott, 1998) e, num segundo momento, observamos, com base na teoria culioliana, os aspectos qualitativos de cada unidade. Com tais ferramentas, foram alcançados resultados significativos sobre frequência, colocados, agrupamentos e posicionamento sintático das marcas que possibilitaram a realização da segunda fase do estudo, ou seja, a descrição semântico-enunciativa das adversativas. É válido notar que, em nossa pesquisa, tentamos não privilegiar as semelhanças entre MAS, PORÉM, CONTUDO, TODAVIA e ENTRETANTO; pelo contrário, buscamos ao mesmo tempo, através de suas características comuns, apontar suas dissimilaridades – sejam elas semânticas, sintáticas ou pragmáticas. O primeiro aspecto que nos chamou a atenção foi a diferença de frequência entre cada uma das marcas. Considerando inicialmente a frequência absoluta das formas, obtivemos por exemplo, através da ferramenta Wordlist, 2.406 ocorrências para MAS, 414 para PORÉM, 47 para  CONTUDO, 14 para ENTRETANTO e 7 para TODAVIA, o que, em termos de frequência relativa, resulta em 0,46% para MAS e 0,08% para PORÉM. Em seguida, com o auxílio da ferramenta Concord, analisamos os colocados e os respectivos agrupamentos de cada item. Numa busca de três palavras à esquerda e três à direita (3L, 3R), encontramos as mesmas formas circunscrevendo MAS, PORÉM e CONTUDO: NÃO, DE, O, QUE, SE e A. Apesar de não aparecerem exatamente na mesma ordem, as formas em questão foram os seis colocados mais recorrentes para as três unidades em destaque. Quanto aos agrupamentos, MAS, PORÉM e CONTUDO apresentaram a sequência X + NÃO em comum, sendo X o nódulo da concordância. Com relação às outras marcas, por sua baixa frequência, nenhum agrupamento significativo foi computado. Quanto ao posicionamento, nosso corpus demonstrou que as marcas adversativas do PB, com exceção de PORÉM, são muito frequentes em posição inicial nos enunciados, após um ponto final (MAS – 62,76%, CONTUDO – 59,57%, ENTRETANTO e TODAVIA – ambos 42,86%, PORÉM – apenas 1,45%). Esses dados, observáveis e analisáveis pelas ferramentas da Linguística de Corpus, foram essenciais para o estudo semântico-enunciativo das unidades, uma vez que destacaram uma rede de elementos sintático-pragmáticos que dificilmente apareceria numa abordagem mais tradicional, em que o linguista parte de um conjunto de enunciados mais restrito, que não abrange a riqueza do uso. Só foi possível, por exemplo, identificar uma relação entre intensidade discursiva e ocorrência das unidades pelo trabalho com corpus. Entendemos por intensidade discursiva o grau de ruptura entre elementos dos enunciados marcado pelas adversativas (Culioli, 2000). Desse modo, conjugando a análise enunciativa à observação dos dados pela Linguística de Corpus, percebemos que quanto maior a frequência da adversativa, maior a sua neutralidade discursiva. Nesse sentido, a marca de maior frequência no corpus, i.e. MAS, apresentou o menor grau de ruptura, como segue: f TODAVIA > f ENTRETANTO > f CONTUDO > f PORÉM > f MAS.  Esse resultado, associado à observação da pontuação, por exemplo, possibilitou o início do estudo sobre a variação semântica das unidades, fundamentada em suas diferenças, que, devido à sua complexidade, está em andamento. Assim, na busca por uma descrição das adversativas do PB, as ferramentas da Linguística de Corpus tornam-se fundamentais para uma pesquisa que visa ao estudo empírico das operações que regem a dinâmica de formas gramaticais a partir de co-textos e contextos específicos. (Apoio: FAPESP – Processo 2008/56075-0)

 

 

Resumos aceitos

by blogadmin

As submissões aceitas estão listadas na página Programação. Ressaltamos que a programação tem caráter provisório, pois é necessário que os autores selecionados façam a inscrição no evento para terem direito a inclusão na programação. Caso não seja feita a inscrição dentro do prazo solicitado no email enviado, a comunicação em questão será retirada da programação e um novo autor será contactado para seu lugar. Tudo isso tem a intenção de evitar espaços vazios durante as sessões de comunicação do ELC, já que não temos sessões paralelas, e cada vaga é muito importante para o sucesso do encontro. Contamos com a compreensão de todos os envolvidos. Obrigado.


Warning: Creating default object from empty value in /home/corpus6/public_html/gelc/inc/settings/model/_abstractsettings.class.php on line 334

<< 1 2 3 4 5 6 7 >>


Strict Standards: Non-static method Hitlist::dbprune() should not be called statically in /home/corpus6/public_html/gelc/inc/_core/_misc.funcs.php on line 248