PALESTRANTES
PALESTRANTES INTERNACIONAIS
Amr El Abbadi - UC Santa Barbara
Essa palestra será proferida em inglês.
Slides da Palestra - Amr El Abbadi
Slides do Tutorial - Amr El Abbadi
Short bio:
Amr El Abbadi is currently a Professor in the Computer Science
Department at the University of California, Santa Barbara. He received his
B. Eng. in Computer Science from Alexandria University, Egypt, and
received his Ph.D. in Computer Science from Cornell University in August
1987. Prof. El Abbadi is an ACM Fellow. He has served as a journal editor
for several database journals, including, currently, The VLDB Journal. He
has been Program Chair for multiple database and distributed systems
conferences, most recently SIGSPATIAL GIS 2010 and ACM Symposium on Cloud
Computing (SoCC) 2011. He has also served as a board member of the VLDB
Endowment from 2002—2008. In 2007, Prof. El Abbadi received the UCSB
Senate Outstanding Mentorship Award for his excellence in mentoring
graduate students. He has published over 250 articles in databases and
distributed systems.
Title:
Delivering the Promise of Scalable and Elastic Data Management in the Cloud
Abstract:
Over the past two decades, database and systems researchers have
made significant advances in the development of algorithms and techniques
to provide data management solutions that carefully balance the three
major requirements when dealing with critical data: high availability,
reliability, and data consistency. However, over the past few years the
data requirements, in terms of data availability and system scalability,
from Internet scale enterprises that provide services and cater to
millions of users has been unprecedented. Cloud computing has emerged as
an extremely successful paradigm for deploying Internet and Web-based
applications. Scalability, elasticity, pay-per-use pricing, and autonomic
control of large-scale operations are the major reasons for the successful
widespread adoption of cloud infrastructures. In this talk, we analyze the
design choices that allowed modern scalable data management systems to
achieve orders of magnitude higher levels of scalability compared to
traditional databases. With this understanding, we highlight some design
principles for data management systems that can be used to augment
existing databases with new cloud features such as scalability,
elasticity, and autonomy. We then analyze several state of the art systems
and discuss our proposed system, G-Store, which provides transactional
guarantees on data granules formed on-demand while being efficient and
scalable. Finally, we will present Zephyr, a technique for on-demand live
database migration, which is critical to provide lightweight elasticity as
a first class notion in the next generation of database systems. Zephyr
efficiently migrates live databases in a shared nothing transactional
database architecture.
Markus Schneider
Slides da Palestra - Markus Schneider
Slides do Tutorial - Markus Schneider
Essa palestra será proferida em inglês.
Short Bio:
Markus Schneider is an Associate Professor at the Department of Computer and Information Science and Engineering of the University of Florida, which is located in Gainesville, Florida, USA. He holds an M.S. degree in Computer Science from the Technical University in Dortmund, Germany, and a Ph.D. degree in Computer Science from the University of Hagen, Germany. His research interests include spatial, spatio-temporal, and moving objects databases, spatial data warehousing and SOLAP, spatial information science, geoinformatics, geographical information systems, applied computational geometry, and extensible databases. He is the co-author of the bookMoving Objects Databases published by Morgan-Kaufmann, the author of the book Spatial Data Types for Database Systems published by Springer-Verlag, and the author of the book Implementation Concepts for Database Systems published by Springer-Verlag. Further, he has published more than 100 journal articles, book chapters, and conference papers. He is on the editorial board of the journal GeoInformatica and a recipient of the 2004 National Science Foundation (NSF) CAREER Award. More details can be found at http://www.cise.ufl.edu/~mschneid.
Title:
"Complex Object Management in Databases: About the Preparedness of Database Technology for New Emerging Applications".
Abstract:
The quantity and nature of data has changed over the years. While the beginning of database technology was characterized by the handling of manageable volumes of alphanumerical data of simple structure, we are now confronted with "big data". The phrase "big data" refers to large, diverse, complex, and/or distributed
data sets. Large data sets are generated, for example, from instruments, sensors, and satellites and usually have a simple internal structure. The focus of this talk is on the aspect of the complexity of big data. New emerging (that is, non-traditional) applications including biological, genomic, multimedia, digital library, imaging, scientific, location-based, geospatial, and spatiotemporal technologies have necessitated the handling of complex application objects. These objects are highly structured, large in size, and of variable representation length. Currently, such objects are handled by using scientific file formats like HDF and NetCDF, or by special, built-in data types in databases like XML and BLOB.
However, some of these approaches are very application specific and/or do not provide proper levels of data abstraction for users. Others do not support random updates or cannot manage large volumes of structured data and simultaneously provide associated high-level operations. In this talk, we consider the state of the art of complex object management in databases and analyze the requirements, solutions, and weaknesses of available approaches. Finally, we introduce our ongoing work on a novel two-step solution to managing and querying complex application objects within databases. The first step introduces a novel data type called Intelligent Binary Large Object (iBLOB) that leverages the traditional BLOB type in databases, preserves the structure of application objects, and provides smart query and update capabilities. The second step consists in a generalized conceptual framework to capture and validate the structure of application objects by means of a type structure specification (TSS). The iBLOB framework generates a type structure specific application programming interface that allows applications to easily access the components of complex application objects. This greatly simplifies the ease with which new type systems for complex application objects can be implemented inside database systems.
PALESTRANTES NACIONAIS
Altigran Soares da Silva
Resumo Curricular:
Altigran Soares da Silva é professor associado do Instituto de
Computação da Universidade Federal do Amazonas (IComp/UFAM) onde atua
como pesquisador, professor e orientador na graduação, mestrado e
doutorado. Concluiu seu doutorado em Ciência da Computação pela
Universidade Federal de Minas Gerais (UFMG) em 2002. Seus interesses
de pesquisa envolvem Gerência de Dados, Recuperação de Informação e
Mineração de Dados com ênfase no ambiente da World-Wide Web. Sobre
estes temas, tem coordenado e participado de dezenas de projetos de
pesquisa que resultaram em mais de 100 publicações científicas em
periódicos e anais de conferência de boa qualidade nestas áreas. Em
2007 foi o Coordenador do Comitê de Programa do Simpósio Brasileiro de
Bancos de Dados (SBBD) e em 2010 atuou com co-chair da trilha
"Bridging Structured and Unstructured Data" da International World
Wide Web Conference. Participou também como membro de comitês técnico
de programa em cerca de 40 conferências e workshops realizados no
Brasil e no Exterior. Em 2012, foi indicado como palestrante convidado
para o SBBD. Exerceu entre 2007 e 2009 a Pró-reitoria de Pesquisa e
Pós-Graduação da UFAM. É atualmente o Coordenador Adjunto da área de
Computação na CAPES e desde 2005 é membro da diretoria da Sociedade
Brasileira de Computação (SBC). É co-fundador de empreendimentos de
tecnologia, entre eles a Akwan Information Technologies, adquirida
pela Google Inc. em 2005.
Titulo da palestra:
Explorando Dados Estruturados em Conteúdo Textual da Web : Métodos,Técnicas e Aplicações
Resumo:
Muito embora as máquinas de busca sejam hoje as mais efetivas e populares ferramentas para recuperar informação na Web, existe hoje um consenso em torno de que ainda é possível explorar de maneira mais
efetiva o potencial destes sistemas. Isso é particularmente verdadeiro no atual cenário de expansão das redes sociais, da consolidação da Web 2.0, e da entrada em cena da chamada Web of Data. Esta constatação motivou o surgimento de várias propostas visando aumentar o poder expressivo das consultas feitas sobre conteúdo da Web, tanto do ponto de vista sintático, por exemplo, através da tecnologia XML, quanto do ponto de vista semântico, por exemplo, através dos recursos conjuntamente conhecidos como Web Semântica. Embora bastante promissoras, algumas destas propostas tem esbarrado na dificuldade da
adoção de padrões, que é uma característica inerente à natureza da Web. Neste apresentação, enfocamos uma outra vertente possível para abordar esta questão: o desenvolvimento de métodos e técnicas para
automaticamente obter, extrair e utilizar dados (semi) estruturados que estão implicitamente disponíveis dentro do vasto conteúdo textual não-estruturado da Web.
Trabalhos que buscam explorar de forma efetiva estes dados têm surgido na literatura há mais de uma década, no entanto, uma série de avanços recentes em Recuperação de Informação, Aprendizagem de Máquina e Mineração de Dados, deram a este tema um novo impulso na comunidade científica. Isso pode ser comprovado pelo espaço considerável que veículos de publicação importantes de áreas como Bancos de Dados, Recuperação de Informação e Inteligência Artificial têm devotado pra trabalhos de pesquisa a ele relacionados. Isso se justifica não apenas pelos problemas desafiadores que se apresentam, mas principalmente pela crescente demanda da indústria para solução destes problemas. Isso faz com que os resultados de pesquisa neste tema sejam não somente imediatamente aplicáveis, mas também realimentem continuamente a investigação científica em torno dele. Este tema envolve várias classes de problemas, sendo que algumas destas classes de problemas serão aqui abordadas, quais sejam: Extração de Dados de Fontes Textuais, Coleta Focada de Páginas Web, Integração de Dados de Fontes Textuais da Web e Busca na Web Considerando Características de Estrutura.
Palestrante da SAP: Christiano Hage (Center of Excellence SAP HANA Brasil)
Resumo Curricular:
Christiano Hage atua no Centro de Excelência da SAP, com foco no appliance de banco de dados in-memory SAP HANA.
Formado em Ciências da Computação, MBA na USP e participação em cursos no MIT, Harvard e Universidade Pierre Mendès France.
Trabalha com TI há 20 anos, sendo 12 em Business Intelligence (BI) & Data Warehousing (DW), tendo atuado em diversos
projetos de BI, no Brasil e no exterior. Trabalha desde 2004 com appliances para DW.
Titulo da palestra:
Computação “in memory”: Conheça o roadmap de inovação da SAP para transformar o mercado de Banco de Dados
Resumo:
A SAP está inovando no mercado de Banco de Dados combinando as experiências da SAP e da Sybase. Em sua essência,
está a inovação do Banco de Dados em memória (in-memory) SAP HANA, que permite que clientes consultem e entreguem
informações em velocidade sem precedentes, centenas a milhares de vezes mais rápido quando comparado às tecnologias
tradicionais, trazendo novas oportunidades e motivando empresas a repensarem seus negócios. Coexistindo com o Banco
de Dados Sybase, as empresas conseguem suportar sistemas legados com baixo TCO, acelerar funções críticas com a
tecnologia in-memory SAP HANA, elevando a organização ao patamar de “empresa em tempo real”.