Download as docx, pdf, or txt
Download as docx, pdf, or txt
You are on page 1of 4

Codificación de imagenes

Designed to learn long-range interactions on sequential data, transformers continue to show state-of-
the-art results on a wide variety of tasks. In contrast to CNNs, they contain no inductive bias that
prioritizes local interactions. This makes them expressive, but also computationally infeasible for long
sequences, such as high-resolution images. We demonstrate how combining the effectiveness of the
inductive bias of CNNs with the expressivity of transformers enables them to model and thereby
synthesize high-resolution images. We show how to (i) use CNNs to learn a context-rich vocabulary of
image constituents, and in turn (ii) utilize transformers to efficiently model their composition within
high-resolution images. Our approach is readily applied to conditional synthesis tasks, where both
non-spatial information, such as object classes, and spatial information, such as segmentations, can
control the generated image. In particular, we present the first results on semantically-guided
synthesis of megapixel images with transformers and obtain the state of the art among autoregressive
models on class-conditional ImageNet. Code and pretrained models can be found at
https://arxiv.org/abs/2012.09841v3

Codificador de descripciones

We present BART, a denoising autoencoder for pretraining sequence-to-sequence models. BART is


trained by (1) corrupting text with an arbitrary noising function, and (2) learning a model to reconstruct
the original text. It uses a standard Tranformer-based neural machine translation architecture which,
despite its simplicity, can be seen as generalizing BERT (due to the bidirectional encoder), GPT (with
the left-to-right decoder), and many other more recent pretraining schemes. We evaluate a number of
noising approaches, finding the best performance by both randomly shuffling the order of the original
sentences and using a novel in-filling scheme, where spans of text are replaced with a single mask
token. BART is particularly effective when fine tuned for text generation but also works well for
comprehension tasks. It matches the performance of RoBERTa with comparable training resources
on GLUE and SQuAD, achieves new state-of-the-art results on a range of abstractive dialogue,
question answering, and summarization tasks, with gains of up to 6 ROUGE. BART also provides a
1.1 BLEU increase over a back-translation system for machine translation, with only target language
pretraining. We also report ablation experiments that replicate other pretraining schemes within the
BART framework, to better measure which factors most influence end-task performance.
https://arxiv.org/abs/1910.13461

● The output of the BART encoder and encoded images are fed through the
BART decoder, which is an auto-regressive model whose goal is to predict
the next token.

https://huggingface.co/dalle-mini/dalle-mini

Creadores

Yes, Boris Dayma (who trained the current version of the AI model) and Pedro
Cuenca (who worked on the backend) are both part of the craiyon team. You can find
more details in the DALL·E mini model card!
Modo de trabajo

The model used is called "DALL·E mini", specifically the larger version also known as
"DALL·E mega" and is trained using Google TRC. You can find more details in the
W&B Project Report and the DALL·E mini model card. You can also watch The Story
Behind DALL·E mini on Gradient Dissent with Boris Dayma.

Términos de uso

https://www.craiyon.com/terms

https://www.xataka.com/basics/dall-e-mini-que-como-puedes-utilizarlo

Cuando comencé a dedicarme al diseño editorial dentro de ésta revista me encontraba en blanco, la
responsabilidad que conlleva el diseño es con las y los lectores, a través de los textos enviados por
las y los autores, se consolidó en la necesidad de crear un espacio propio para su lectura: La claridad
del texto y la facilidad en la lectura son la base para su maquetación, una ilustración, que puede ser
una ventana a la imaginación, invita a encontrarla en las letras, a la vez que la página misma acoge
al conjunto, lo integra y proporciona a la vez la distinción del texto en si mismo y su integración como
conjunto en el número de la revista.

Durante el proceso de idear la forma de la maquetación de la presente revista tuve la fortuna de


encontrar en redes sociales, a menudo dentro de un contexto hilarante, imágenes retorcidas,
personas con rostros irreconocibles e incluso objetos cuya caracterización dejaba mucho a la
imaginación eran elementos que son adecuados para ilustrar un número titulado “Horror & Weird”. La
diferencia fundamental ésta vez consistiría en la propiedad de las ilustraciones y por ello considero
necesario dedicar algunas palabras al “artista” que se encuentra detrás de las abominaciones de
pesadilla que acompañan ésta vez a los textos.

Haga clic en esta dirección de sitio web para unirse.


https://us02web.zoom.us/w/82885536131?tk=mTTQzDDYyidWgMV4-
xRG1fhO6teaLt1eBa2kX23VVAM.DQMAAAATTFzpgxZBSnNWUGNDQlNaZWRrZnp2ZnBtQ
zVRAAAAAAAAAAAAAAAAAAAAAAAAAAAAAA&pwd=emJESkM4cjE3aVMwZDRWSHRWa
FVhUT09
Al iniciar el diseño de la maquetación de éste número, probé y evalué diversos medios para crear los
espacios de lectura que procuro crear para cada texto. Uno de los principales problemas con los que
me enfrento, y probablemente el más decisivo que conformará el tema y la ambientación del número
consiste en ilustrarlos adecuadamente, sin embargo mi formación dista bastante de ser un ilustrador
así que comencé alterando imágenes con derechos libres y Creative Commons que permitían su
alteración para ilustrar los primeros números.

La creación de contenido visual para ilustrar posee mucha demanda en el mundo virtual, la forma en
que el mundo es presentado frente a nuestros ojos a la vez de cómo nos hemos apropiado de él para
hacerlo más aprehensible y llamativo exige una imagen con la cual asociarlos para tener un lugar en
la atención de las personas.

Una de las muchas propuestas que buscan solventar esa demanda viene de la mano

La creación artística del autor frente a la máquina


Las bases de la programación como parte de lo humano
La necesidad de la ilustración y la creación del espacio de lectura
La mayor exigencia del autor frente a las IAś
Aspectos técnicos de la IA la partición de la imagen en fragmentos
La visualización del mundo como un conjunto de operaciones lógicas
Lo humano como parte de lo instintivo

A menudo me parece que el último vestigio que nos determina como seres humanos es nuestro
irascible instinto que evoca al espíritu a actuar en contra de razón hacia el oscuro abismo de la
provocación. El atractivo vértice restringe la virtud de ceder tan sólo frente al arte y aquélla
complicada delimitación que nos impide encerrarla en un concepto inmovil como hacen las ciencias
naturales.

La dicotomía que me provocó en este caso dedicarle unas palabras al ente que ha creado algunas de
las imágenes que se encuentran conformando parte del espacio de lectura del presente número, fue
precisamente la solución que encontré para ilustrar los textos, la cual, detonó una serie de
interrogantes que debería hacernos replantear el modo en el cual asimilamos y expresamos nuestra
humanidad.

Si partimos de la premisa de que innovar dentro del apartado artístico es algo sumamente difícil por
no decir prácticamente imposible. Se sigue que las formas de las cuales se obtiene la inspiración
para crear una obra es por medio de la obra de arte previamente creada, de la cual, se extraen los
elementos esenciales del artista como espectador para formar parte de su obra. La extracción puede
variar conforme al pensamiento particular de cada artista y es precisamente en esa visión donde se
puede encontrar algo que se le parezca al estilo propio de cada artista.

La sistematización de ese proceso, por otro lado, podría enfocarse en obtener elementos objetivos de
las obras de arte para de ese modo, generar un sistema más o menos lógico para crear obras de
arte, convirtiéndo el proceso de creación, en un problema matemático. Lo cual, sin embargo, no sería
algo ajeno a lo humano, sino todo lo contrario, la razón sobre el arte podría ser el comienzo de la
cúspide de nuestro autoconocimiento como especie.

La idea que acabo de describir parece inverosímil y seguramente quién esté leyendo encontrará una
serie de argumentos e ideas que se oponen a ésta concepción. Pero es la forma descriptiva por
medio de la cual funciona la inteligencia artificial que crea imágenes a partir de una entrada de texto.
Lo increíble en ella no es que “entienda” lo que decimos al pedirle que cree una imagen, sino el
hecho de que puede “ver” los elementos asociados a una palabra, a una disposición o incluso a un
estilo de ilustración. Así el mérito que han ganado estos proyectos es precisamente haber propuesto
un método para analizar la complejidad de una imagen, tanto para leerla, como para crearla.

¿Es capaz, entonces, de crear arte una computadora? La respuesta a ésta pregunta la podemos
dejar para que cada quién reflexione y realice sus propias conclusiones. Quizá se está confundiendo
la técnica con el arte, sin embargo la distinción entre ambas es un problema en sí mismo cuando
consideramos la necesidad de ésta para consolidar un proyecto artístico. Una definición amplia de
arte podría verse en severos problemas intentando resolver cualquiera de esas cuestiones y una
demasiado rígida dejaría afuera muchas obras.

Personalmente considero que, si la computadora hace arte, esto no haría que fuera arte no humano,
pero si esto genera alguna clase de incomodidad, entonces quizás la creación de estas inteligencias
artificiales deberían plantear una mayor exigencia en las obras de arte creadas por seres humanos,
para que, de este modo, permanezca como un elemento propio del espíritu y aquella visión romántica
del arte, sobreviva.

You might also like