h1

Pullum sobre Chomsky en la UCL

20 noviembre 2011

El 10 de octubre pasado Noam Chomsky dio una polémica charla en la University College London (UCL). Nada raro en eso. (Se puede ver el video haciendo click aquí).

Hoy, Geoffrey Pullum envió a través de Linguist List una respuesta ciertas partes de la charla de Chomsky. Se trata de un documento corto, pero sumamente interesante. Lo pego a continuación. Al final voy a hacer un breve comentario a favor de Chomsky. Mi comentario, quiero aclarar, no se basa tanto en el contenido de la polémica, sino en la postura que toma Chomsky.

About a month ago (10 October 2011) Noam Chomsky spoke at an invitation-only seminar at University College London (UCL).  I attended along with about 90 other British linguists.  The announced title was: “On the poverty of the stimulus”.  The video of both the talk and the question period is available: (http://www.ucl.ac.uk/psychlangsci/research/linguistics/news-events/latest-news/n_chomsky; henceforth, UCL video). In what follows I summarize some of the content of Chomsky’s London talk and its question session, and explain some of my reactions.
Chomsky’s remarks in London were not very different in tone from things he has said elsewhere: the UCL presentation was extremely similar to a lecture given at Carleton University in Canada last April (http://www.youtube.com/watch?v=XbjVMq0k3uc), and echoed themes from Chomsky’s talk at the symposium on the biology of language at the 2011 Cognitive Science Society conference in Boston last July, and journal articles such as “Language and other cognitive systems” (Chomsky 2011), and particularly the paper “Poverty of the stimulus revisited” (Berwick et al. 2011, henceforth BPYC-2011). These recent talks and papers share a steadfast refusal to engage with anything that might make the debate about the poverty of the stimulus (POS) an empirical one.  They issue blanket dismissals of nearly all modern cognitive/linguistic science as worthless, and sweep aside whole genres of work on the basis of what seems to be extremely shallow acquaintance.  Claims about parallels in the natural sciences feature prominently, as does a preference for authority over evidence.  I will discuss a selection of topics, without attempting to be very systematic.
1. ROCKS AND KITTENS
Two aspects of the way Chomsky chose to deal with the topic of stimulus poverty struck me as startling.  The first was that he stuck entirely with the version of the argument from POS that the late Barbara Scholz used to call the rocks-and-kittens version.
A child’s pet kitten (so the argument goes), exposed to the same primary linguistic data as the child, learns no language at all, and is indistinguishable from a rock in this regard.  Since the linguistic inputs are the same, an innate interspecies difference in language readiness and capacity for language acquisition must be involved; therefore linguistic nativism is true.  (This is not parody, as I scarcely need to document: Chomsky has happily repeated his views on kittens and the like many times.  A Google search on a pattern as specific as {Chomsky granddaughter rock kitten innate} will yield tens of thousands of hits, nearly all relevant ones.  See Smith 1999: 169-170, or Stemmer 1999, or Chomsky 2000: 50 for quotable quotes in print.)
At UCL Chomsky didn’t really give even this much of an argument: he just noted that humans had a genetic endowment that permitted them to learn language, and stipulated that he would call it Universal Grammar (UG). (Compare, e.g., “The faculty of language then is a special property that enables my granddaughter but not her pet kitten or chimpanzee to attain a specific I-language on exposure to appropriate data…”
(http://hotbookworm.wordpress.com/2010/01/11/noam-chomsky-the-biolinguistic-turn-lecture-notes-part-two/.)
He even admitted that “intellectually … there’s just nothing to it — [it's] a truism” (UCL video, 3:42); but he went on to argue that there is “a kind of pathology in the cognitive sciences” (UCL video, 4:24) in that its practitioners obdurately refuse to accept the simple point involved.
The real trouble, of course, is that everyone accepts it — nobody doubts that there is something special about humans as opposed to kittens and rocks — but they do not recognize it as a scientific result concerning human beings or their capacities.
What I had imagined would be under discussion in this seminar is the specific view about the character of human first language acquisition that is known as linguistic nativism.  This is a substantive thesis asserting that language acquisition is largely guided by an intricate, complex, human-specific, internal mechanism that is (crucially) independent of general cognitive developmental capacities.  This assertion seems to me worthy of serious and lengthy discussion.  The rocks-and-kittens claim is surely not.  We all agree that kittens and rocks can’t acquire language, and that it’s not because they don’t get sufficient exposure.  But that hardly amounts to support for linguistic nativism over general nativism (Scholz & Pullum 2002: 189).
It’s not that Chomsky doesn’t recognize the distinction between linguistic nativism and general nativism.  He says (Chomsky 2000: 50, reproduced at (http://www.chomsky.info/books/architecture01.htm):
”Now a question that could be asked is whether whatever is
innate about language is specific to the language faculty or
whether it is just some combination of the other aspects of
the mind. That is an empirical question and there is no reason
to be dogmatic about it; you look and you see. What we seem
to find is that it is specific.”
But to say that you simply look and see, when the question is as subtle and difficult as this one and concerns mechanisms inaccessible to the tools we currently have, is surely not a responsible characterization of what science involves.
2. STIMULUS POVERTY WITHOUT STIMULUS
The second striking choice Chomsky made was to address the poverty of the stimulus without ever mentioning the stimulus at all.  This was POS without the S.  One would expect that when someone claims that the child’s input is too poverty-stricken to support language acquisition through ordinary learning from experience, they would treat empirical observations about the nature of that input as potentially relevant.  It would give a POS argument some empirical bite if one could specify ways in which the child’s input was demonstrably too thin to support learning of particular features of language from experience of language use.  That would seem worthy of attention.  The rocks-and-kittens version does not.  I was very surprised that Chomsky stuck to it so firmly (though that does explain his lack of interest in the child’s input: the rocks-and-kittens argument doesn’t need anything to be true or false of the input).
The POS issue is going to take a long time to resolve if we can’t even focus on roughly similar versions of the purported argument. Yet Chomsky regards it as crucial that it be resolved.  He began his talk, in fact, with some alarmist remarks about the prospects for linguistics (“the future of the field depends on resolving it”: UCL video, 4:38).  If we do not settle this question of stimulus poverty, he claimed, we are doomed to seeing our subject shut down.  So he portrays current skepticism among cognitive scientists about linguistic nativism as not just obtuse, but actively harmful, a threat to our whole discipline.
This is an interesting (if rather risky) new way of stoking enthusiasm for linguistic nativism: appeal to linguists’ self-interest and desire for security (you don’t want to be shut down, do you?).  But it’s hard to take seriously.  Linguistics is not going to die just because a fair number of its practitioners now have at least some interest in machine learning, evolutionary considerations, computational models of acquisition, and properties of the child’s input, and are becoming acquainted with probability theory, corpus use, computer simulation, and psychological experimentation — as opposed to waving all such techniques contemptuously aside.
3. THE LESSON OF BAYES’ THEOREM
Chomsky went on to remind us all of the linguists and psychologists in the 1950s who (allegedly) stuck so rigidly to corpus data that they regarded experiments going beyond the corpus data as almost a betrayal of science.  And he stressed that the work of people today who work on Bayesian learning of patterns or regularities from raw data has no value at all (“zero results”).  He compared their modeling of phenomena to physicists making statistical models to predict the movements of medium-sized physical objects seen outside in the street (UCL video, 36:41).
I think such a blanket dismissal overlooks a crucial conceptual contribution that Bayesian thinking makes to theoretical linguists, one that has nothing to do with the statistical modeling on which Chomsky pours such scorn.  Many linguists have given the impression that they think it is impossible to learn from positive data that something is not grammatical.  Lightfoot (1998: 585) suggests, for example, that although you can perhaps learn from experience that auxiliary reduction is optional in the interior of a clause, you cannot possibly learn that it is forbidden at the end of a clause; hence linguistic nativism has to be true. This reasoning is flawed, and Bayes’ Theorem teaches us why.
The lesson is that probability of a generalization G being correct given a body of evidence E is not dependent merely on whether E contains crucial evidence confirming G over its rivals.  The probability of G is proportional to the product of the antecedent probability of G’s being true with something else: the probability that the evidence would look like E if G were true.  That means that what is absent from experience can be crucial evidence concerning what the grammar has to account for. For example, all the thousands of times you’ve heard clause-final auxiliary verbs uncontracted strengthen the probability that they’re not allowed to contract.
The argument from absence of stimulus is pretty much demolished by this Bayesian insight: the argument form simply is not valid.  And for people who use the phrase “the logical problem of language acquisition” (as linguistic nativists have been doing since 1981), that ought to mean something.  It certainly seems to me sufficient to justify including at least a brief introduction to Bayesian statistical reasoning in the education of every theoretical linguist.
Suppose, though, that it ultimately turns out that the current fashion for constructing Bayesian computational models of learning is something of a dead end.  It still doesn’t follow that it is deleterious.  Much can be learned by watching models ultimately fail.  There is no threat to the discipline here: linguistics is not so fragile that it will collapse just because one possibly false trail was followed.
The people interested in Bayesian modeling and similar computational lines of research are smart enough to eventually perceive its inadequacy (if indeed it is inadequate), and will move to something that looks more interesting.  People get bored in dead-end ventures.  I talked to Roger Brown in 1968 and he told me that the reason he had abandoned Skinnerian behaviorism ten years before had nothing to do with any revolutionary new ideas in scientific thinking about cognition or the impact of Chomsky’s famous review of Skinner: he was just bored with the work that behaviorism demanded, and wanted to try something more interesting. Intellectually agile people want to move on.
4. BIAS AT THE NSF
About half-way through his talk, Chomsky made some claims about the probability of success with proposals to the NSF to fund research projects on Universal Grammar (UG).  He said: “If you want a grant from the National Science Foundation, you better not include that [the phrase "UG"] in your proposal; it will be knocked out before it even reaches the review board” (UCL video, 30:35).
He warmed to this theme: “If you want to get a grant approved, you have to have the phrase ‘sophisticated Bayesian’ in it, and you also have to ask for an fMRI, especially if you have nothing whatever to do with it” (he chuckled here and there was general laughter) “… if you meet those two conditions, you might make it through the granting procedures” (UCL video, 31:02).
Then he returned to the claim that “UG” will doom your proposal: “But if you use a dirty word like UG, and you say there’s something special about humans and we’ve got to find out what it is, that pretty much rules it out” (UCL video, 31:18). And then, with no chuckling, he added: “I’m not joking; I have concrete cases in mind … of good work that just can’t get funded, because it doesn’t meet these conditions…  Right at MIT in fact” (UCL video, 31:28).
Since award details are public information, it is trivial to find out whether the NSF is making awards for purely theoretical study of UG in a Chomskyan perspective.  And it is. Željko Bošković’s grant “On the Traditional Noun Phrase: Comparing Languages With and Without Articles” (BCS-0920888) is an example.  And MIT is not left out.  For example, David Pesetsky obtained Doctoral Dissertation Research grant no. BCS-1122426 for a project “Argument licensing and agreement”; the abstract begins: “Which properties of human language are universal, and which may vary across languages?  Answering these questions will help us understand the unique human capacity for language, through which we hope to gain insight into the overall architecture of the human mind.”  And Chomsky must know that his co-author Robert Berwick received grant BCS-0951620 for a “Workshop on Rich Grammars from Poor Inputs” at MIT in 2009.
Naturally, many NSF proposals mentioning UG will go unfunded — the majority, given that across the board less than 25% of grant proposals get funded.  But (of course) proposals are sent out for peer review whether they mention UG or not, and whether they mention Bayes or not.
It seems a strange strategy to make claims of this sort to an audience of linguistics professionals in a foreign country who would have little knowledge of the NSF, and send out the message to young investigators internationally that following Chomsky’s theoretical line will blight their careers by dooming their chances of NSF funding. Even if this were true, it would give the impression of a fractious field that has bad relations with its most important Federal funding agency.  But it is much stranger to make such statements when they are easily discovered to be false.
5. AN UNCOMPREHENDED QUESTION ABOUT MACHINE LEARNING
In the question period there was an extremely unfortunate interaction when the computational learning experimenter Alexander Clark tried to ask a question.  Chomsky interrupted and began his answer before Clark had managed to make his point.  The question Clark want to put was roughly the following (I knew enough to see where he was going, and he has confirmed to me that this was what he meant).
A paper Clark had published with Eyraud (2007) on learning some kinds of context-free grammars (CFGs) from positive data is dismissed in BPYC-2011 as useless.  Chomsky repeated that dismissal in his talk. But Clark’s more recent work has focused on languages in the much larger context-sensitive family that are generated by minimalist grammars as formalized by Edward Stabler.  These are strongly equivalent to the Multiple Context-Free Grammars (MCFGs) that were invented by Seki & Fujii (1991), as Clark tried to begin to explain.  He was not attempting to say anything about CFGs, but to raise the issue of learning the languages of minimalist grammars, or equivalently MCFGs.  This is a wildly different class, vastly larger than the class of CFGs.  It corresponds to the infinite union, for all natural numbers N, of a hierarchy of classes of languages (each definable in several ways) in which the first few steps are these:
N = 0      finite languages
N = 1      regular (finite-state) languages
N = 2      context-free languages
N = 3      tree adjoining languages
N = 4      …
There has been much relevant mathematical work on these matters between 1984 and the present by people like Gerald Gazdar, Henk Harkema, Aravind Joshi, Greg Kobele, Jens Michaelis, Carl Pollard, Kelly Roach, James Rogers, Edward Stabler, K. Vijay-Shanker, and David Weir (it is easily findable; I will not try to give even a brief bibliography here.)  If Stabler has accurately captured the intent of the hints in the “minimalist program” about Merge and feature-checking, then minimalism embraces an enormous proper superset of the context-free languages.  (I say “if” because Chomsky declines to refer to any of Stabler’s work, so we don’t know whether the formalization is acceptable as a precise reconstruction of the minimalist program as he conceives of it.)
Clark was trying to get Chomsky’s reaction to recent results (see e.g. Clark 2010) exhibiting efficient algorithms for learning various subclasses of the MCFGs, including some fairly large classes going well beyond CFGs.
Chomsky interrupted the question and began to talk about CFGs.  But he misspoke, and talked about having proved in 1959 that CFGs are equivalent to linear bounded automata (they aren’t; LBAs are equivalent to context-sensitive grammars).  Even if CFGs had been equivalent to LBAs, and even if Chomsky had been responsible for results on LBAs in 1959 (he wasn’t, it was Kuroda five years later), CFGs had nothing to do with the observation Clark was trying to make about MCFGs.  And Chomsky had in any case never proved any theorems about learnability, which was what Clark was trying to ask about. Clark’s question not only was never answered, it was not even heard, hence of course not understood.
6. LANGUAGES EVOLVING
After Clark’s question, there were only a few more. I was lucky enough to be allocated time to ask two brief questions before the session ended.  Chomsky had condemned language evolution work wholesale (“a burgeoning literature, most of which in my view is total nonsense”: UCL video, 27:08), and I asked him to speak more directly about Simon Kirby’s research on iterated learning of initially randomly structured finite languages, which he has shown leads to the rapid evolution of morphological regularity.
Chomsky’s answer was that it is not at all interesting if successive generations of learners regularize the language they are trying to learn: the regularity emerges only because human intelligence and linguistic competence is utilized in the task, and if you gave the same task to computers the same evolution would not happen.
Kirby’s group has in fact addressed both those points, and both claims appear to be false.  It seems to be the cognitive bottleneck of memory limitation that forces the emergence of regularity (decrease in Kolmogorov complexity) in the language over learning generations, not human linguistic capacity or intelligence (note the remark of Kirby, Cornish, & Smith 2008: 10685, that “if participants were merely stamping their own linguistic knowledge onto the data that they were seeing, there would be no reason we would find rampant structured underspecification in the first experiment and a system of morphological concatenation in the second”).  And the effect of weak learning bias being amplified by cultural transmission through iterated learning does indeed turn up when the learner is simulated on a computer (see e.g. Kirby, Dowman, and Griffiths 2007).
There is an opportunity for substantive discussion here.  And since both Chomsky and Kirby are invited speakers at the upcoming EvoLang conference in Kyoto (http://kyoto.evolang.org/), there will be a forum where it could happen.  I hope it will.  But maybe I’m too optimistic: I see the current integration of computationally-assisted cognitive science with careful syntactic description and theorizing as precisely what should inspire confidence that the language sciences in the 21st century has a bright future rather than spelling doom to linguistics.
7. GENETIC FIXITY
The other topic I was able to ask about was the scientific plausibility of a view that has a remarkable genetic quirk arising between 50,000 and 200,000 years ago, giving a single developing hominid species an unprecedented innate UG that permits articulate linguistic capacities, and then remaining absolutely fixed in all of its details until the present.
A very few linguists (they include James McCawley, Geoffrey Sampson, and Philip Lieberman) have pointed out this prediction of genetically determined variation in UG between widely separated human groups.  Lieberman notes that dramatic evolutionary developments like disappearance of lactose intolerance or radical alteration in the ability to survive in high-altitude low-oxygen environments can take place in under 3000 years; yet (as Chomsky stresses) the evidence that any human being can learn any human languages is strong, suggesting that UG shows no genetic variation at all.
Why would UG remain so astonishingly resistant to minor mutations for so many tens of thousands of years?  There is no selection pressure that would make it disadvantageous for Australian aborigines to have different innate constraints on movement or thematic role assignment from European or African populations; yet not a hint of any such genetic diversity in innate linguistic capacities has ever been identified, at least in grammar.  Why not?
Chomsky’s response is basically that it just happened.  He robustly insists that this kind of thing happens all the time in genetics: all sorts of developments in evolution occur once and then remain absolutely fixed, like the architecture of our visual perception mechanism.  Human beings, he told me solemnly, are not going to develop an insect visual system over the coming 50,000 years.
This was his final point before his schedule required him to leave, and I had to agree with him (so let’s not have any loose talk about kneejerk disagreement, OK?) — we’re not going to develop insect eyes.  But I couldn’t help thinking that this hardly answered the question. There are parts of our genome that remain identical for hundreds of millions of years, like HOX genes; but generally they cause catastrophic effects on the organism if incorrectly expressed.  Even with the visual system, arbitrary changes could put an organism in real trouble.  For widely separated populations of humans to have different constraints on remnant movement wouldn’t do any damage at all, and it would offer dramatic support for the view that there is a genetically inherited syntax module (though the “U” of UG would now not be so appropriate).
So it was just as with the rocks-and-kittens POS argument: I agree with the starting observations, as everyone must; but the broader conclusions that Chomsky defends, and more generally his extremely negative attitude to computer simulation work, human-subject experimentation, evolutionary investigations, and data-intensive research don’t seem to follow.
I am not pessimistic enough to believe that contemporary experimental research in the cognitive and linguistic sciences — Bayesian and connectionist work included — will prove to be some kind of toxic threat to our discipline.  I think it represents an encouragingly lively and stimulating contribution. I think we have a responsibility as academics to acknowledge such work and do our best to appreciate its methods and results. It won’t do anything clarify our understanding of language if we simply condemn it all out of hand.
Geoff Pullum
University of Edinburgh
REFERENCES
Berwick, Robert; Paul Pietroski; Yankama; and Noam Chomsky (2011). [BPYC-2011]  Poverty of the stimulus revisited.  Cognitive Science 35: 1207–1242.
Chomsky, Noam (2000). The Architecture of Language.  New Delhi: Oxford University Press.
Chomsky, Noam (2011). Language and other cognitive systems: What is special about language?  Language Learning and Development 7 (4): 263-278.  http://dx.doi.org/10.1080/15475441.2011.584041
Clark, Alexander (2010).  Efficient, correct, unsupervised learning of context-sensitive languages.  Proceedings of the Fourteenth Conference on Computational Natural Language Learning, 28-37. Uppsala, Sweden: Association for Computational Linguistics. http://www.cs.rhul.ac.uk/home/alexc/papers/conll2010.pdf
Clark, Alexander, and Remi Eyraud (2007). Polynomial time identification in the limit of substitutable context-free languages. Journal of Machine Learning Research, 8, 1725–1745.
Kirby, Simon; Michael Dowman; and Thomas Griffiths (2007). Innateness and culture in the evolution of language.  Proceedings of the National Academy of Sciences, 104 (12): 5241-5245.
Kirby, Simon; Hannah Cornish; and Kenny Smith (2008). Cumulative cultural evolution in the laboratory: An experimental approach to the origins of structure in human language. Proceedings of the National Academy of Sciences, 105 (31): 10681-10686.
Lightfoot, David (1998).  Promises, promises: general learning algorithms. Mind and Language 13: 582-587.
Seki, Matsumura and Kasami Fujii (1991).  On multiple context-free grammars.  Theoretical Computer Science 88: 191-229.
Smith, Neilson Voyne (1999).  Chomsky: Ideas and Ideals.  Cambridge: Cambridge University Press.
Stabler, Edward (1997).  Derivational minimalism.  Christian Retore, Logical Aspects of Computational Linguistics (Lecture Notes in Artificial Intelligence, 1328), 68-95.  Berlin: Springer Verlag.
Stemmer, Brigitte (1999).  An on-line interview with Noam Chomsky: On the nature of pragmatics and related issues.  Brain and Language 68 (3): 393-401.

Si bien no estoy de acuerdo con la postura cuasi-separacionista que parece promover Chomsky con respecto a otros métodos y perspectivas sobre el estudio del lenguaje, creo que es necesario reconocer el valor de su postura.

Como es sabido, la gramática generativa clásicamente asume que el lenguaje es algo así como un “órgano mental”, un aspecto de la cognición que, mayormente, está definido por principios evolutivos (sean cuales sean). Gracias a esta concepción, gracias a este marco, el estudio de la gramática se convirtió en algo científico. (Por supuesto, no estoy diciendo que antes no lo fuera, sino que la concepción chomskyana del lenguaje le permitió al gramático pasar a un primer plano en la discusión sobre la naturaleza de la mente humana). Cuando se hace gramática ya no sólo se está describiendo un fenómeno gramatical de una lengua X, sino se están  elaborando teorías acerca del funcionamiento de ese órgano que es el lenguaje. Cada análisis gramatical involucra una concepción definida de ciertos aspectos de la Facultad del Lenguaje.

La postura de Chomsky es contra aquellos que en mayor o menor medida sostienen que es exagerado considerar el lenguaje como un órgano. Si el lenguaje no es un órgano, si el lenguaje es sólo una serie de rutinas adquiridas por un proceso estocástico general, entonces la función del gramático pierde mucho sentido. Si el objeto de estudio del gramático deja de ser un órgano mental cuya existencia se asume real, sus análisis sólo son observaciones momentáneamente válidas sobre un conjunto de transiciones probabilísticas.

También comparto el pesimismo de Chomsky con respecto a varios tipo de estudios probabilísticos: la estadística puede ser útil para predecir datos, pero es inútil para explicarnos la naturaleza de la Facultad del Lenguaje. Mientras asumamos que el lenguaje es algo más que una conducta adquirida y que tiene características que le son propias, la predicción estocástica del comportamiento lingüístico será (al menos científicamente) de escaso valor.

h1

Sobre las Jornadas Patagónicas de Lingüística Formal

18 octubre 2011

La semana pasada se llevaron a cabo las Primeras Jornadas Patagónicas de Lingüística Formal. Creo que puedo afirmar que el evento fue todo un exito, dado que se contó con la presencia de investigadores de toda la Argentina, de Uruguay y Brasil. Las ponencias tuvieron un excelente nivel y hubo un intercambio riquísimo de conocimiento. Misión cumplida, jornadas.

Dejo algunas fotos.


Sandra Cvejanov y su ponencia sobre concordancia locativa en LSA.
 

Poster de Lucas Brodersen y María del Rosario Tartaglia sobre procesamiento lingüístico en pacientes de Alzheimer.
 

María Mare y su ponencia sobre recíprocos discontinuos.
 

Algunos de los asistentes a las jornadas pudieron disfrutar de una excursión en las cercanías de la ciudad de General Roca.
h1

EVELIN 2012

15 septiembre 2011

Buenas noticias para los lingüistas de sudamerica: del 12 al 21 de enero del próximo año se vuelve a realizar la Escuela de Verano de Lingüística Formal (EVELIN). Para quienes no lo sepan, se trata de una escuela de verano que se llevó a cabo en Campinas durante varios años, siempre con figuras sumamente importantes del campo. Dos semanas de lingüística al palo…

En esta ocasión, hay siete invitados que presentarán los avances de sus últimas investigaciones:

Linguística Computacional: Phonological trends in the lexicon
Michael Becker (University of Massachusetts)

Tópicos em sintaxe II: The Identity thesis for language and music
David Pesetsky (MIT)

Tópicos em Fonologia I: Onsets – Suprasegmental and Prosodic Behaviour
Nina Topinzi (Technological Educational Institute of Patras & MIT)

Tópicos em Fonologia II: Vowel reduction and consonant lenition: two sides of the same coin
Andrew Nevins (University College London)

Psicolinguística: Efficiency in language learning, processing, and grammar
T. Florian Jaeger (Brain and Cognitive Sciences, Computer Science, University of Rochester)

Tópicos em Sintaxe I: Recursividade: propriedade específica e única do componente computacional?
Cilene Rodrigues (University College London)

Tópicos em Semântica I: Scalar implicature and cognitive architecture
Raj Singh (Cognitive Science, Carleton University)

Otros de los cursos estarán dictados por:

• Sintaxe II: Jeremy Hartman
• Fonologia II: Peter Graff
• Semântica I: Guillaume Thomas
• Semântica II: Yasutada Sudo
• Tópicos em Semântica II: Guillaume Thomas & Yasutada Sudo
• Métodos de Campo I: Rafael Nonato
• Métodos de Campo II: Suzi Lima

Los dos últimos días se llevará a cabo un workshop. Veinte trabajos en total serán aceptados. El plazo para enviar abstracts será durante el mes de octubre.

Ésta y más información también pueden encontrarla en la página web de EVELIN 2012.

h1

Mucha actividad

19 agosto 2011

Todos habrán notado que la actividad del blog ha disminuido muchísimo en el último año. Debo aclarar que esto no se debe a una pérdida de interés de mi (nuestra) parte ni nada parecido. Es sólo que hemos estado muy ocupados. Por ejemplo, hemos tenido en Buenos Aires la visita de Jairo Nunes, quien dictó un seminario sobre teoría de control (y nos vendió de manera magistral que el control es movimiento-A…) y el excelente seminario sobre elipsis de Andrés Saab. Este martes a las 18 hs. tendremos la breve visita de Yael Sharvit, quien dará una charla sobre teoría del ligamiento. A partir de septiembre tendremos los cursos de Ron Smyth de estadística para lingüistas y de Giammatteo y Albano sobre clasificación de predicados verbales. Y la cosa sigue en octubre, cuando se realicen las Jornadas Patagónicas de Lingüística Formal… En fin, creo que las cosas están mejorando por aquí para la lingüística.

Pero mi idea no era contar todo eso, sino postear una imagen que me tomé el trabajo de editar. La imagen original me pareció excelente, pero el chiste dejaba bastante que desear. No se me ocurrió nada mejor que eso, así que el diálogo que mantienen los personajes en primer plano no está. Si a alguien se le ocurre algo gracioso para completar el chiste… bueno, para eso están los comentarios.

 

h1

Divide y vencerás (?)

11 mayo 2011

Como saben, el Grupo Minimalista surgió para discutir diversos aspectos del lenguaje. Lamentablemente, al día de hoy nos hemos centrado sólo en la sintaxis del lenguaje natural. Por eso, hemos decidido abrir dos grupos de lectura más: uno de biolingüística y uno de semántica. He aquí algo de información para quienes estén interesados.

GRUPO DE SINTAXIS

El grupo de sintaxis se va a reunir el lunes 16 de mayo a las 17 hs en el Instituto de Lingüística. Vamos a ver un fragmento del artículo Movement out of Control de Idan Landau (el apartado 5, “Raising versus control”) y vamos a comenzar con la respuesta que le dan Cedric Boeckx y Norbert Hornstein en un artículo titulado Movement under Control.

Una vez que terminemos con ese texto veremos con qué material continuamos: podemos seguir con Control, para afilarnos todavía más con el tema para el seminario que dictará en agosto Jairo Nunes (esa fue la idea desde el principio al escoger este tema), o bien podemos comenzar a trabajar con elipsis, para ponernos a punto para el seminario que va a dictar Andrés Saab en julio/agosto. La bibliografía en ese caso deberían ser algunos trabajos de Jason Merchant y del propio Saab. En fin, ya veremos.

GRUPO DE BIOLINGÜÍSTICA

El término “biolingüística” es bastante difícil de definir en términos simples, sobre todo por la gran afinidad que se le ha atribuido a la lingüística generativa (que se define como un enfoque biolingüístico, no como la biolingüística misma). Para evitarnos problemas en la caracterización o definición de un marco teórico, aquí simplemente diremos que nuestro interés es plantear problemas que involucren al lenguaje humano en tanto fenómeno biológico.

La selección de lecturas para el primer ciclo del grupo está íntimamente relacionada con el que ha sido llamado “el problema más difícil” de la ciencia moderna: la evolución del lenguaje. Para ello, comenzaremos con la lectura de un artículo de Guillermo Lorenzo que servirá como introducción al estudio biolingüístico, y luego discutiremos uno de los trabajos más representativos de una explicación darwiniana para la evolución del lenguaje, Natural Language and Natural Selection, de Pinker y Bloom. Las lecturas subsecuentes abordarán aspectos más particulares del debate que se desarrollan en varios marcos teóricos.

La primera reunión del grupo será el lunes 23 de mayo a las 17 hs en el Instituto de Lingüística. La presentación del artículo de Lorenzo estará a cargo de Julian Lozada.

  •  El giro biolingüístico, por Guillermo Lorenzo.
  •  Natural Language and Natural Selection, por Steven Pinker y Paul Bloom.
  •  The Language Mosaic and its Evolution, por James Hurford.
  •  Symbol and Structure: a comprehensive framework for Language Evolution, por Derek Bickerton
  •  What are the uniquely human components of the language faculty, por Marc Hauser y Tecumseh Fitch.
  •  Motor control, speech, and the evolution of human language, por Philip Lieberman
  •  Minimizing Language Evolution: the Minimalist Program and the evolutionary shaping of language, por Victor M. Longa, Guillermo Lorenzo y Juan Uriagereka

GRUPO DE SEMÁNTICA

Armar un corpus bibliográfico para esto se convirtió en una tarea bastante complicada, sobre todo porque no nos dábamos una idea de hacia donde ir. Después de mirar muchos programas de semántica avanzada (el de UMass, el del MIT y otros), decidimos empezar por algo a la vez básico y avanzado, más o menos al alcance de todos: Gamut II. Para quienes no lo sepan, estoy haciendo referencia a la obra Logic, Language and Meaning, escrito por un grupo de investigadores europeos que responden el seudónimo GAMUT. Nosotros leeremos el segundo tomo. Hay una versión traducida al español de Eudeba.

El libro está dividido en siete capítulos cortos. Nosotros, en consecuencia, abordaremos la obra en siete encuentros. Ya veremos luego qué nuevo material trabajamos.

El primer encuentro del grupo de semántica será el martes 31 de mayo a las 17 hs en el Instituto de Lingüística. Los temas que se abordarán (es decir, los capítulos del libro) son los siguientes:

  1. The origins of Intensional Logic
  2. Intensional Propositional Logic
  3. Intensional Predicate Logic
  4. The Theory of Types and Categorial Grammar
  5. The Intensional Theory of Types
  6. Montague Grammar
  7. Recent Developments

Quien lo desee puede descargar una grilla con fechas y lecturas de los grupos haciendo click aquí.

h1

por dió…

29 marzo 2011

El video es suficientemente elocuente. Disfrútenlo (?).

h1

Steven Pinker animado

4 marzo 2011

Si hay un investigador del lenguaje que merecía ser convertido en dibujo animado (ya sea por su trascendencia o por su memorable look) es Steven Pinker.

Me encantó la animación…

h1

New paths in Linguistic Theory: Starke vs. Boeckx en tres rounds

10 febrero 2011

Por supuesto, lo de “versus” es un chiste. (aunque espero que en el CLT no se lo tomen tan en serio como para organizar apuestas, vender merchandising y cosas así…). Bueno, ya hablando en serio: lo que habrá en unos días en será un interesante debate que involucrará a Michal Starke y Cedric Boeckx, cada uno defendiendo su propio marco teórico dentro de los planteos generales del Minimalismo.

En Argentina estamos algo familiarizados con las ideas de Boeckx (más aún luego del seminario del año pasado de Ángel Gallego), pero debo reconocer que muchas de las ideas de la Nanosintaxis (Nanosyntax), modelo teórico en el que se inscribe Starke actualmente, me son del todo desconocidas. Ojalá se publique algún tipo de acta del evento (*guiño*).

Más datos a continuación (y podrán encontrar información actualizada aquí).

Since the arrival of the Minimalist Program (Chomsky 1995), syntactic theory has tried to find ways to implement its fundamental guidelines. Along this line we can consider Nanosyntax, defended by Michal Starke (CASTL/Universitetet i Tromsø) and the Free Merge model developed by Cedric Boeckx (ICREA-Universitat Autònoma de Barcelona/CLT) like two of these paths that have found a wider repercussion. That is why the understanding of how these two theories contrast can be of interest for the linguistic community.
Therefore, on the 21st, 23rd and 25th of February debate sessions between both linguists will take place at the Universitat Autònoma de Barcelona, each of the sessions consisting in a part of exposition and another with debate and questions.
Place: Facultat de Filosofia i Lletres, UAB
Room: To be announced
Time: In the afternoon (to be announced)
Organized by Centre de Lingüística Teòrica with support from the projects HUM 2006-13295-C02-01: “Rasgos sintácticos y realización morfofonológica” (IP Carme Picallo); and FFI2010-20634: “Una nueva orientación biolingüística para la variación lingüística” (IP Cedric Boeckx).
Organizing comitee: Carlos Rubio and Adriana Fasanella.
h1

Fallecimiento de Jean-Roger Vergnaud

4 febrero 2011

Con mucho pesar, transmito una triste noticia que circuló ayer en Linguist List: el fallecimiento de Jean-Roger Vergnaud.

With the permission of his wife, Professor Maria Luisa Zubizarreta, The Department of Linguistics of the University of Southern California, with the deepest of sorrow and regret, announces the passing, 31 January 2011, of our wonderful colleague, teacher, and friend, Andrew W. Mellon Professor of the Humanities Jean-Roger Vergnaud, whose  contributions to us individually, and to our subject, will always be remembered.

Para ser sincero, no conozco el trabajo de Vergnaud en fonología, pero siempre sentí admiración por la manera en que creó la Teoría del Caso. Esto fue a partir de un trabajo de Chomsky y Lasnik de 1977 titulado Filters and Control en el que se discutía el siguiente fenómeno (tomo el corpus de oraciones de un artículo de Bobaljik y Wurmbrand titulado Case in GB/Minimalism):

  1. Leo decided [ (*Lina/himself) to leave ].
  2. Leo believed [ Lina to be a genius ].
  3. Leo decided  [ for Lina to leave ].
  4. For Leo to win would be great.
  5. *Leo to win would be great.

Como puede verse, el sujeto de un infinitivo no puede ser un nominal abierto (como se ve en 1 y 5), pero esta restricción puede violarse cuando la cláusula de infinitivo es el complemento de determinado tipo de verbo (como believe, en 2), o cuando la cláusula de infinitivo está encabezada por una preposición (en 3 y 4). Chomsky y Lasnik quisieron explicar la distribución de los nominales en estas oraciones a través de la siguiente regla / filtro:

* [α NP to VP], unless α is adjacent to and in the domain of Verb or for ([-N])

Esto se lee más o menos así: “una construcción α (supongamos que α es una oración) en la que un nominal es adyacente a un sintagma verbal no finito es agramatical a menos que α esté adyacente y en el dominio de un verbo o de una preposición for“.

No hay que ser un genio hoy en día para notar el carácter meramente descriptivo de esta regla.Aquí es donde entra en juego Vergnaud. Él lee una versión previa del trabajo de Chomsky y Lasnik y les envia una carta con comentarios. Por algún azar del destino, la carta no llega a destino hasta después que el artículo ya fue publicado. En fin, la carta (que puede encontrarse hoy en día en el libro Foundational Issues in Linguistic Theory: Essays in Honor of Jean-Roger Vergnaud) empieza así:

Dear Howard, Dear Noam,
I got your paper, three weeks ago. It is quite exciting. I believe I have some ideas to communicate to you now. They may not be that well organized, but they bear on what you discuss.

“Algunas ideas que comunicarles”. Genio.

I believe that this filter could be replaced by a filter that governs the distribution of certain kinds of NPs. Here is what I have in mind. Let’s assume that English has three Cases: the Subject Case, which is the Case of subjects in tensed clauses; the Genitive Case (cf. Mary’s book, hers, yours, mine, etc.); the Governed Case, which is the case of complements of verbs and of prepositions, among others (cf. Mary saw him, Mary gave him a book, Mary talked to him, a book by him, etc.).

Hay algunas diferencias, por supuesto… lo que aquí llama Caso Regido (Governed Case) subsume las posteriores nociones de Caso acusativo y oblicuo, por ejemplo. Pero notarán que básicamente es lo mismo que se puede leer en cualquier manual de gramática generativa bajo el rótulo de Teoría del Caso. En fin, con estos supuestos, Vergnaud reformula el filtro propuesto por Chomsky y Lasnik de la siguiente manera:

A structure of the form …[α...NP...]…, where NP is in the Governed Case and a is the first branching node above NP, is ungrammatical unless (i) α is the  domain of [-N] or (ii) α is adjacent to and in the domain of [-N].

En términos posteriores, esto se traduce en que un nominal debe mantener una relación local con una categoría [-N] (una preposición o un verbo) para que ésta le asigne Caso. Como es sabido, esta idea, de una manera u otra, se mantiene hasta la actualidad.

Sin embargo, esto no es lo más genial del asunto. Apenas unos renglones más abajo en la carta, y refiriéndose a lo que acaba de proponer, Vergnaud dice:

[This] filter looks very much like a principle of UG…

“Un principio de la Gramática Universal”. He aquí el verdadero valor de la propuesta de Vergnaud: inicia un quiebre en la historia de la gramática generativa, el paso de un modelo de reglas a uno basado en principios universales de buena formación gramatical.

En fin, creo que con eso es suficiente como para que quienes no lo conocían sepan por qué fue tan importante y para que quienes lo conocían lo recuerden un poco mejor.

h1

Cuestiones de método y obtención de datos en gramática generativa

1 febrero 2011

Últimamente he perdido bastante tiempo pensando en los aspectos más “epistemológicos” de la gramática generativa. Cierto punto que ha despertado mi interés es la discusión existente entre quienes plantean que los datos del gramático deben provenir de corpus lingüísticos y quienes sostienen que lo mejor es basarse en las “intuiciones” de los hablantes. Algo de esto es lo que transcribo a continuación en un fragmento que adapté parcialmente a partir del capítulo introductorio a Syntax: A Generative Introduction, de Carnie.

La aplicación del método científico a la sintaxis involucra considerar cuáles serán las fuentes de nuestros datos. Una fuente obvia es la compilación de textos hablados o escritos. Tales fuentes son denominadas corpora (singular: corpus). Hay muchos corpora disponibles al alcance de cualquier investigador (muchas son accesibles a través de internet). Por otro lado, aquellas lenguas que no tienen una larga tradición literaria o son habladas por un grupo minoritario deben ser investigadas a partir de otras fuentes. Así, muchas veces es necesario que el lingüista compile datos haciendo estudio de campo. De hecho, ésta fue la principal tarea de los lingüistas en la primera parte del siglo XX y es, en la actualidad, llevada adelante por gran número de investigadores.

Si bien los corpora son incuestionablemente una fuente importantísima de datos, los mismos sólo son una representación parcial de la realidad psicológica de la sintaxis. En concreto, los corpora sólo contienen oraciones gramaticales (i.e. oraciones que “suenan bien” a los oídos de un hablante nativo), y ya se ha mencionado que es necesario testear nuestras hipótesis con evidencia negativa para probar su falsabilidad. Incluso aquellos corpora basados en la recopilación de errores reales no necesariamente contienen el tipo de dato que necesitamos.

Las restricciones de los corpora no se limitan sólo a su falta de datos negativos. Un corpus es, por definición, sólo un muestreo de las formas que se registran en una lengua. El problema es que la naturaleza intrínsecamente productiva y creativa del lenguaje hace que no exista manera de que un corpus contenga, al menos, una muestra representativa de las oraciones gramaticales de una lengua. Si basamos nuestra teoría únicamente en los corpora, tendremos una teoría que predecirá los datos que han sido registrados, pero eso no nos garantiza que estemos describiendo fielmente qué es la sintaxis humana.

Vayamos a un caso más concreto. Considérese la siguiente oración:

(4)          *¿Qué te preguntas quién compró?

Para todo hablante de español, (4) es casi una ensalada de palabras, no un oración bien formada. ¿Cómo lo saben? ¿Alguien se encargó de enseñarle a la gente que no se pueden decir cosas como (4)? El hecho de que una oración como (4) suene mal pero oraciones similares como la de (5) suenen bien no está reflejado en ningún corpus.

(5)          ¿Quién pensás que compró la computadora?

La diferencia que hay entre (4) y (5) es central para el requisito de predictibilidad que impone el método científico sobre nuestras teorías (i.e. debemos ser capaces de predecir que la sintaxis del español puede generar (5) pero no (4)). Para detectar este contraste es necesario confiar en el conocimiento de nuestra lengua nativa (o en el conocimiento de un informante hablante nativo, para el caso de lenguas que no hablemos). Nótese que este tipo de conocimiento no esconsciente: es poco probable que las personas en general sepan por qué (4) está mal formada (y, sin embargo, se dan cuenta de ello). La tarea del sintactista debe ser describir este conocimiento inconsciente.

El experimento psicológico que se utiliza para dar cuenta de este tipo de conocimiento inconsciente es llamado tarea de juicio gramatical. El juicio gramatical consiste en pedirle a un hablante nativo que lea o escuche una oración y juzgue si está bien formada (gramatical), marginalmente bien formada, o definitivamente mal formada (inaceptable o agramatical). La tarea de juicio gramatical tiene una base científica bien establecida, dado que la prueba puede ser replicada bajo condiciones experimentales estrictamente controladas. Además, otras disciplinas también utilizan tareas de juicios basados en conocimiento inconsciente: en el estudio de la visión, por ejemplo, se ha determinado que las personas pueden establecer acertadamente la diferencia entre distintos grados de intensidad de luz.

Pues bien, justamente hoy me topé con un trabajo en el que se ha demostrado parcialmente que la metodología que ha venido utilizando la gramática generativa es adecuada con respecto a la realidad psicológica del lenguaje. La investigación en cuestión fue realizada por Jon Sprouse y Diogo Almeida y lleva el descriptivo título de The 469 data points that form the empirical foundation of generative syntactic theory are at least 98% replicable using formal experiments. He aquí el abstract (que traduje al español):

Los juicios de gramaticalidad en el campo de la sintaxis generativa han sido objeto de un desarrollo informal, es decir, no se han ajustado estrictamente a los métodos formales de la psicología experimental. Dos tipos de argumento han sido propuestos para la adopción de técnicas experimentales en la sintaxis generativa: (i) que este tipo de experimento provee una mejor herramienta de medición, y (ii) que las técnicas informales son una herramienta en la que no se puede confiar. Mientras que (i) es relativamente aceptado, el segundo argumento ha sido objeto de un considerable debate debido a que sugiere que los datos utilizados para construir las actuales versiones de la teoría generativa son falsos. Para investigar esta cuestión, testeamos los 469 tipos de dato que aparecen en un popular manual de sintaxis generativa [Core Syntax, de Adger (2003)] con 440 participantes, utilizando estimaciones de magnitud, tareas de si-no y tres tipos distintos de análisis estadístico. El estudio sugiere que la tasa de error máxima para los resultados aportados informalmente es del 2%, o para ponerlo de otra forma, que la base empírica de la teoría sintáctica generativa es al menos un 98% replicable con experimentos formales. Estos resultados sugieren (i) que el uso extenso de juicios recolectados informalmente en la sintaxis generativa no ha llevado a construir teorías basadas en datos falsos, y (ii) que si bien existen muchos motivos para que los sintactistas generativos adopten metodología experimental más formal, la inadecuación de la base empírica de la teoría no es una de ellos.

A quien le interese, el trabajo de Sprouse y Almeida puede descargarse desde aquí.

Seguir

Get every new post delivered to your Inbox.