Sharing the instruction cache among lean cores on an asymmetric CMP for HPC applications

UPCommons - dt., 07/25/2017 - 17:01
Sharing the instruction cache among lean cores on an asymmetric CMP for HPC applications Milic, Ugljesa; Rico, Alejandro; Carpenter, Paul; Ramirez, Alex High performance computing (HPC) applications have parallel code sections that must scale to large numbers of cores, which makes them sensitive to serial regions. Current supercomputing systems with heterogeneous or asymmetric CMPs (ACMP) combine few high-performance big cores for serial regions, together with many low-power lean cores for throughput computing. The low requirements of HPC applications in the core front-end lead some designs, such as SMT and GPU cores, to share front-end structures including the instruction cache (I-cache). However, little work exists to analyze the benefit of sharing the I-cache among full cores, which seems compelling as a solution to reduce silicon area and power. This paper analyzes the performance, power and area impact of such a design on an ACMP with one high-performance core and multiple low-power cores. Having identified that multiple cores run the same code during parallel regions, the lean cores share the I-cache with the intent of benefiting from mutual prefetching, without increasing the average access latency. Our exploration of the multiple parameters finds the sweet spot on a wide interconnect to access the shared I-cache and the inclusion of a few line buffers to provide the required bandwidth and latency to sustain performance. The projections with McPAT and a rich set of HPC benchmarks show 11% area savings with a 5% energy reduction at no performance cost.
Categories: Novetats

Catalogue of vibration reduction index formulas for heavy junctions based on numerical simulations

UPCommons - dt., 07/25/2017 - 16:29
Catalogue of vibration reduction index formulas for heavy junctions based on numerical simulations Poblet-Puig, Jordi; Guigou-Carter, Catherine The vibration reduction index (Kij) is a key parameter in the prediction of flanking transmissions according to the EN-12354 standard. Formulas for the evaluation of Kij in L, T and X junctions that depend on the mass ratio are available in the Annex E. Junctions of straight elements with different thickness or thin elastic layers are also included. However, other junction types that are important for building industry are not considered: H-shaped junctions, L or T junctions not forming a right angle, asymmetrical T-junctions , X-junctions where only one of the parts is different (thickness or material) from the other two/three. In the current research, expressions for these non-covered junctions are provided. They are obtained by means of numerical simulations based on the spectral finite element method. Kij is predicted for a large population of junctions, considering usual thicknesses and heavy material combinations (no lightweight frame systems have been considered). Statistical analysis is carried out to obtain relatively simple formulae that could be used in acoustic design projects without the need for time-consuming computations with finite element software. © (2017) S. Hirzel Verlag/European Acoustics Association. The definitive publisher-authenticated version is available online at and http// Readers must contact the publisher for reprint or permission to use the material in any form.
Categories: Novetats

Interactive GPU-based generation of solvent-excluded surfaces

UPCommons - dt., 07/25/2017 - 16:26
Interactive GPU-based generation of solvent-excluded surfaces Hermosilla, Pedro; Krone, Michael; Guallar, Victor; Vázquez, Pere-Pau; Vinacua, Àlvar; Ropinski, Timo The solvent-excluded surface (SES) is a popular molecular representation that gives the boundary of the molecular volume with respect to a specific solvent. SESs depict which areas of a molecule are accessible by a specific solvent, which is represented as a spherical probe. Despite the popularity of SESs, their generation is still a compute-intensive process, which is often performed in a preprocessing stage prior to the actual rendering (except for small models). For dynamic data or varying probe radii, however, such a preprocessing is not feasible as it prevents interactive visual analysis. Thus, we present a novel approach for the on-the-fly generation of SESs, a highly parallelizable, grid-based algorithm where the SES is rendered using ray-marching. By exploiting modern GPUs, we are able to rapidly generate SESs directly within the mapping stage of the visualization pipeline. Our algorithm can be applied to large time-varying molecules and is scalable, as it can progressively refine the SES if GPU capabilities are insufficient. In this paper, we show how our algorithm is realized and how smooth transitions are achieved during progressive refinement. We further show visual results obtained from real-world data and discuss the performance obtained, which improves upon previous techniques in both the size of the molecules that can be handled and the resulting frame rate.
Categories: Novetats

A systematic analysis of scoring functions in rigid-body protein docking: The delicate balance between the predictive rate improvement and the risk of overtraining

UPCommons - dt., 07/25/2017 - 16:10
A systematic analysis of scoring functions in rigid-body protein docking: The delicate balance between the predictive rate improvement and the risk of overtraining Barradas-Bautista, Didier; Moal, Iain H.; Fernández-Recio, Juan Protein-protein interactions play fundamental roles in biological processes including signaling, metabolism, and trafficking. While the structure of a protein complex reveals crucial details about the interaction, it is often difficult to acquire this information experimentally. As the number of interactions discovered increases faster than they can be characterized, protein-protein docking calculations may be able to reduce this disparity by providing models of the interacting proteins. Rigid-body docking is a widely used docking approach, and is often capable of generating a pool of models within which a near-native structure can be found. These models need to be scored in order to select the acceptable ones from the set of poses. Recently, more than 100 scoring functions from the CCharPPI server were evaluated for this task using decoy structures generated with SwarmDock. Here, we extend this analysis to identify the predictive success rates of the scoring functions on decoys from three rigid-body docking programs, ZDOCK, FTDock, and SDOCK, allowing us to assess the transferability of the functions. We also apply set-theoretic measure to test whether the scoring functions are capable of identifying near-native poses within different subsets of the benchmark. This information can provide guides for the use of the most efficient scoring function for each docking method, as well as instruct future scoring functions development efforts.
Categories: Novetats

Circumventing UV light induced nano-morphology disorder to achieve long lifetime PTB7-Th:PCBM based solar cells

UPCommons - dt., 07/25/2017 - 15:33
Circumventing UV light induced nano-morphology disorder to achieve long lifetime PTB7-Th:PCBM based solar cells Liu, Quan; Toudert, Johann; Liu, Feng; Mantilla-Perez, Paola; Montes Bajo, Miguel; Russell, Thomas P.; Martorell, Jordi Large area flexible electronics rely on organic or hybrid materials prone to degradation limiting the device lifetime. For many years, photo-oxidation has been thought to be one of the major degradation pathways. However, intense illumination may lead to a burn-in or a rapid decrease in performance for devices completely isolated from corrosive elements as oxygen or moisture. The experimental studies we present in here indicate that a plausible triggering for the burn-in is a spin flip after a UV photon absorption leading to the accumulation of electrostatic potential energy that initiates a rapid destruction of the nano-morpholgy in the fullerene phase of a polymer cell. To circumvent this and achieve highly stable and efficient devices, we induce a robust nano-crystalline ordering in the PCBM phase prior to UV illumination. In that event, PTB7-Th:PC71BM cells are shown to exhibit T80 lifetimes larger than 1.6 years under a continuous UV-filtered 1-sun illumination, equivalent to 7 years for sunlight harvesting at optimal orientation and 10 years for vertical applications.
Categories: Novetats


UPC OpenCourseware - dt., 07/25/2017 - 00:00
* Formar als estudiants per pogué exercir la professió d'acord amb els requisits establerts en la normativa aplicable
*Coneixer la normativa de les Societats de Regulació
*Aplicar l'Electrònica al vaixell
Competències per fer:
* Manteniment
* Detecció d'avaries
*Calibració de sistemes a bord
* Entendre els sistemes de seguretat
This course will evaluate the following STCW competences:
Manage operation of electrical and electronic control equipment
Manage operation of
electrical and electronic control equipment
Manage trouble?shooting, restoration of electrical and electronic control equipment to operating condition
Categories: Novetats


UPC OpenCourseware - dt., 07/25/2017 - 00:00
Formar als estudiants per poder exercir la professió D'Enginyer en GEM i GESTN, d'acord als requisits establerts en la normativa aplicable.
This course will evaluate the following STCW competences:
6. Operated electrical, electronic and control systems
E1. Monitor the operation of electricla, electronic and control systems
Categories: Novetats


UPC OpenCourseware - dt., 07/25/2017 - 00:00
Formar als estudiants per poder exercir la professió d'Enginyer en Nàutica i Transport Marítim, d'acord als requisits establerts en la normativa aplicable.
Categories: Novetats

Diagnosi i proposta d'intervenció de la casa Sellam El-Haj

UPCommons - dv., 07/21/2017 - 15:27
Diagnosi i proposta d'intervenció de la casa Sellam El-Haj Mateu Mateus, Josep; Fontanella Morera, Albert El proyecto expuesto a continuación, corresponde al Trabajo Final de Grado de la titulación de Arquitectura Técnica cursada en la Escuela Politécnica Superior de Edificación de Barcelona, Universidad Politécnica de Cataluña. El proyecto surge como iniciativa de nuestros tutores para elaborar un manual de recuperación del patrimonio propio de la arquitectura marroquí. De la mano del Centro de Cooperación para el Desarrollo (CCD) de la UPC, un grupo de 4 estudiantes y dos profesores, nos desplazamos a la ciudad de Tetuán, como actividad extracurricular del DAC de Impacto Ambiental y Eficiencia Energética. Durante nuestra estancia en Tetuán, acudimos al XIII Congreso Internacional del CICOP, donde pudimos asistir a varias ponencias y talleres prácticos sobre arquitectura tradicional y nuevas tecnologías aplicadas a la edificación en tierra. A partir de aquí, y con la idea preexistente de elaborar dicha guía, se nos ofreció realizar el estudio de diagnosis de la Casa Sellam El-Haj, una de las construcciones más destacadas de la Medina de Tetuán, ya que representa un buen ejemplo de arquitectura tradicional tetuaní del siglo XIX, encontrando en ella muchos elementos característicos y singulares de las técnicas constructivas locales. Sellam El-Haj es una edificación de carácter privado, con una superficie construida aproximada de 1300 m2, dispuesta en 4 niveles principales, sin embargo, se puede observar que muchas de las habitaciones que componen la vivienda, se encuentran en niveles intermedios. Su arquitectura característica y su sección constructiva tan irregular, dan como resultado una construcción a estudiar tan complicada como interesante. La familia que habitaba la casa, los el-Haj, son de origen argelino, que emigraron a la ciudad de Tetuán cuando los franceses conquistaron su país natal en el año 1830. Muchos miembros de la familia ocuparon importantes cargos en la administración pública de la ciudad. Su posición privilegiada, fue la que propició que en diversas fases de construcción de la casa, se fuera ampliando el espacio original, e incluso se introdujesen elementos decorativos claramente influenciados por la cultura europea, siempre en conjunto con la tradición local y la andalusí. Cabe destacar, que diversas personalidades de gran relevancia han pasado bajo los arcos de la casa, un ejemplo seria el Rey Mohammad V, en el año 1957, o el naviero griego Aristóteles Onasis. A pesar de la época de esplendor que vivió Sellam El-Haj antaño, actualmente, y desde hace algunos años, se encuentra totalmente deshabitada y los efectos del paso del tiempo y la falta de mantenimiento, han pasado factura a su riqueza original. Tan solo entrando en el patio ajardinado, se puede observar el estado de degradación del edificio, cuya decadencia continua en las estancias principales; derrumbes de forjados, humedades en casi todas las habitaciones, grietas que recorren muros enteros, desprendimientos del tan característico zellige tetuaní e incluso crecimientos vegetales en las paredes y arcos. La gran cantidad de elementos decorativos originales presentes, que necesitan de una urgente y meticulosa intervención, junto con la voluntad de elaborar un manual de recuperación que respete las técnicas tradicionales y las conserve, es lo que impulsa este proyecto. En él, y a partir del levantamiento completo del edificio (que hicimos in situ), realizaremos el diagnóstico de lesiones y propondremos una intervención adecuada a las características de la casa y de la medina, que dificultan cierto tipo de actuaciones debido a sus estrechas calles y su densa concentración de edificios, y a partir del trabajo, realizado con la colaboración y participación de profesorado y estudiantado de la EPSEB, vinculados al proyecto en distintas fases, nos permitirá elaborar, en el futuro, un manual donde se definan las intervenciones adecuadas para este tipo de edificaciones tradicionales de la arquitectura marroquí, siempre respetando, al máximo posible, la artesanía propia, con la filosofía de recuperar antes que substituir, para revalorizar los elementos originales que, en definitiva, y tal y como declara la UNESCO, nos pertenecen a todos.
Categories: Novetats

Disseny, càlcul i projecte d'estructures per a un edifici d'oficines al 22@ de Barcelona

UPCommons - dv., 07/21/2017 - 15:10
Disseny, càlcul i projecte d'estructures per a un edifici d'oficines al 22@ de Barcelona Fitó Castells, Ernest
Categories: Novetats

Efecto de la variación angular en el vértice de alimentación de la antena fractal de Sierpinski

UPCommons - dv., 07/21/2017 - 15:06
Efecto de la variación angular en el vértice de alimentación de la antena fractal de Sierpinski Puente Baliarda, Carles; Navarro Bernal, Manuel; Romeu Robert, Jordi; Pous Andrés, Rafael
Categories: Novetats

El programari lliure i de codi obert a l'ESO com a eina per educar en el treball cooperatiu.

UPCommons - dv., 07/21/2017 - 14:13
El programari lliure i de codi obert a l'ESO com a eina per educar en el treball cooperatiu. Moragues Pastor, Josep Vicenç L'ús de programari lliure i de codi obert és una realitat ja present a l'ensenyament de secundària (una senzilla enquesta realitzada durant aquest treball entre els alumnes d'un centre així ho mostra). Hi ha uns motius evidents que poden explicar aquest fet: són programes gratuïts, de fàcil accés, i amb ells s'evita que s'estengui entre els alumnes l'ús il·legal de programes comercials obtinguts sense pagar-ne la llicència. La intenció d'aquest treball és mostrar un altre possible benefici d'emprar programari lliure a l'escola: aquests programes són, en general, el fruït d'un esforç cooperatiu d'una comunitat de programadors i usuaris, que posen el seu treball a disposició de tothom, gratuïtament. En molts casos els programadors fan la seva tasca de manera voluntària i no remunerada, dedicant-hi el seu temps lliure. Ajudar els alumnes a conèixer aquesta realitat, i a aportar també ells alguna cosa del que han après com a retorn a la comunitat, pot constituir per a ells una bona manera d'avançar en la capacitat de treballar de forma cooperativa i en equip, capacitat que la legislació educativa a Catalunya estableix com un dels objectius de l'ESO, i que els documents normatius sobre les competències bàsiques citen repetidament. Aquest treball es proposa oferir orientacions pràctiques als docents de cara a aprofitar pedagògicament aquesta dimensió cooperativa del programari lliure. La intenció és que els docents puguin ajudar als alumnes no només a conèixer les eines de programari, sinó també les comunitats que les han creat, comunitats a les que ells es poden adreçar per obtenir ajuda i per compartir experiències. El fruit que n'espero d'aquesta proposta és que els alumnes puguin copsar una mica millor que cooperant entre tots es poden assolir grans fites. I també n'espero que a partir d'això es puguin acostar als projectes de programari lliure amb una actitud més activa i participativa, i no com simples consumidors d'un producte ja acabat.
Categories: Novetats

Recursos Moodle i utilització de noves metodologies educatives al mòdul professional estructures de construcció

UPCommons - dv., 07/21/2017 - 14:08
Recursos Moodle i utilització de noves metodologies educatives al mòdul professional estructures de construcció Plantalamor Seguí, Aina L'objectiu d'aquest treball és desenvolupar diferents recursos a la plataforma Moodle per a l'ensenyament i l'aprenentatge del mòdul professional estructures de construcció, comú a tots els cicles formatius de grau superior de la família professional d'edificació i obra civil. Es proposa preparar tot el material de dos nuclis formatius determinats, utilitzant recursos de diferents tipus a la plataforma i que inclouran l'aplicació de metodologies variades. Aquesta feina de preparació d'activitats d'ensenyament i d'aprenentatge té dues finalitats, la primera és intentar avançar més ràpidament en el conjunt de continguts, i la segona és analitzar quins són els millors recursos per a la docència d'aquesta matèria (així com estudiar quina és la reacció dels estudiants a noves mecàniques de funcionament). Dintre de la plataforma Moodle, es pretén preparar varis tipus de recursos, tant per facilitar material d'aprenentatge als estudiants com per avaluar-los (i estudiar si és viable la realització d'un examen per via telemàtica).; El objetivo de este trabajo es desarrollar diferentes recursos dentro de la plataforma Moodle para la enseñanza y el aprendizaje del módulo profesional estructuras de construcción, común en todos los ciclos formativos de grado superior de la familia profesional de edificación y obra civil. Se propone preparar todo el material de dos núcleos formativos determinados, utilizando recursos de distintos tipos en la plataforma y que incluirán la aplicación de metodologías variadas. Este trabajo de preparación de actividades de enseñanza y de aprendizaje tiene dos finalidades, la primera es intentar avanzar más rápidamente en el conjunto de contenidos, y la segunda es analizar cuáles son los mejores recursos para la docencia de esta materia (así como estudiar cuál es la reacción de los estudiantes a nuevas mecánicas de funcionamiento). Dentro de la plataforma Moodle, se pretende preparar varios tipos de recursos, tanto para facilitar material de aprendizaje a los estudiantes como para evaluarlos (y estudiar si es viable la realización de un examen por vía telemática).; The objective of this work is to develop different resources into the Moodle platform for teaching and learning of the subject construction structures. It is proposed to prepare the material for two units of this subject, using different types of resources of the platform that will include the application of various methodologies. This work preparation activities of teaching and learning has two purposes, the first one is to try to move more quickly in the set of contents, and the second is to analyze what are the best resources for teaching this subject (and study what is the reaction of students to these new mechanical operations). Into the Moodle platform, the intention is to prepare several types of resources, to facilitate learning material for the students and to evaluate them (and study if it is feasible to realize an electronic exam).
Categories: Novetats

Cirurgia assistida mitjançant visió per computador

UPCommons - dv., 07/21/2017 - 14:04
Cirurgia assistida mitjançant visió per computador Cote Rojas, Sergi En aquest projecte s'ha desenvolupat una solució informàtica que, a partir de l'enregistrament en vídeo d'una cirurgia mínimament invasiva, és capaç de detectar i marcar sobre aquest vídeo les eines utilitzades per el cirurgià.; In this project an informatic solution has been developed which, given a recording video of a minimal invasive surgery, it is able to detect and point on this video the surgical tools that has been used.
Categories: Novetats

Computing methods for parallel processing and analysis on complex networks

UPCommons - dv., 07/21/2017 - 14:02
Computing methods for parallel processing and analysis on complex networks Vázquez Benítez, Luis Andrés Nowadays to solve some problems is required to model complex systems to simulate and understand its behavior. A good example of one of those complex systems is the Facebook Social Network, this system represents people and their relationships, Other example, the Internet composed by a vast number of servers, computers, modems and routers, All Science field (physics, economics political, and so on) have complex systems which are complex because of the big volume of data required to represent them and their fast change on their structure Analyze the behavior of these complex systems is important to create simulations or discover dynamics over it with main goal of understand how it works. Some complex systems cannot be easily modeled; We can begin by analyzing their structure, this is possible creating a network model, Mapping the problem´s entities and the relations between them. Some popular analysis over the structure of a network are: • The Community Detection – discover how their entities are grouped • Identify the most important entities – measure the node´s influence over the network • Features over whole network like – the diameter, number of triangles, clustering coefficient, and the shortest path between two entities. Multiple algorithms have been created to give a result to these analyses over the network model although if they are executed by one machine take a lot of time to complete the task or may not be executed due to machine limitation resources. As more demanding applications have been appearing to process the algorithms of these type of analysis, several parallel programming models and different kind of hardware architecture have been created to deal with the big input of data, reduce the time execution, save power consumption and enhance the efficiency in the computation in each machine also taking in mine the application requirements. Parallelize these algorithms are a challenge due to: • We need to analyze data dependence to implement a parallel version of the algorithm always taking in mine the scalability and the performance of the code. • Create a implementation of the algorithm for one parallel programming model like MapReduce (Apache Hadoop), RDD (Apache Spark), Pregel(Apache Giraph) these oriented to bigdata or HPC models how MPI + OpenMP , OmpSS or CUDA. • Distribute the data input over the processing platform for each node or offload it into accelerators such as GPU or FPGA and so on. • Store the data input and store the result of the processing requires techniques of Distribute file systems(HDFS), distribute NoSQL Data Bases (Object Data Bases, Graph Data Bases, Document Data Bases) or traditional relational Data Bases(oracle, SQL server). In this Master Thesis, we decided create Graph processing using Apache bigdata Tools mainly creating testing over MareNostrum III and the Amazon cloud for some Community Detection Algorithms using SNAP Graphs with ground-truth communities. Creating a comparative between their parallel computational time execution and scalability.
Categories: Novetats

Generació procedural de coves en 3D

UPCommons - dv., 07/21/2017 - 13:57
Generació procedural de coves en 3D Lafita Secanilla, Alec En aquest treball es pretén implementar un algoritme per poder dur a terme una generació procedural de coves, cavernes, mines o masmorres tridimensionals que el jugador podrà inspeccionar i recórrer per dins, així com ser una eina expansible per a poder integrar-ho al desenvolupament d'un videojoc.; En este trabajo se pretende implementar un algorismo para poder obtener una generación procedural de cuevas, cavernas, minas o mazmorras tridimensionales que el jugador podrá inspeccionar i recorrer por dentro, así como ser una herramienta expandible para poder integrarlo en el desarrollo de un videojuego.; The aim of this project is to implement an algorithm to generate caves, caverns, mines and dungeons’ threedimensional models through procedural generation. This generation will give the player the possibility to explore it as well as to be an expandable tool that will help to integrate it on a videogame development.
Categories: Novetats

Proposta d'adaptació didàctica, específica per a alumnes amb dislèxia, de la unitat didàctica de tecnologia de 2n d'ESO “La indústria alimentària”

UPCommons - dv., 07/21/2017 - 13:54
Proposta d'adaptació didàctica, específica per a alumnes amb dislèxia, de la unitat didàctica de tecnologia de 2n d'ESO “La indústria alimentària” Carreras Ruiz, Sandra Aquest treball té com a propòsit facilitar el procés d'aprenentatge a l'alumnat dislèctic, per aconseguir aquesta determinació s'han fixat tres objectius; primerament fer una cerca intensiva sobre el trastorn d'aprenentatge "dislèxia", les seves característiques, les conseqüències associades i el seu context legal, en segon lloc, es proposa una adaptació de la unitat didàctica de la matèria de tecnologia de 2n d'ESO "La indústria alimentària" aplicant els nous coneixements obtinguts amb la cerca i finalment, la redacció d'una proposta de protocol d'adaptació didàctica específica per alumnat dislèctic pel Departament de Tecnologia del centre. Algunes de les activitats proposades en l'adaptació de la unitat didàctica, la indústria alimentària, s'han aplicat en el centre del pràcticum. Els resultats han estat positius en part, s'ha observat una millora en l'actitud d'alguns alumnes, han estat més participatius i han realitzat les tasques encomanades, aquest alumnat no mostrava cap motivació vers la matèria i es mostrava totalment passiu. Per altra banda els resultats acadèmics no han millorat. Les conclusions finals del treball obre possibles temes per fer altres recerques. Tot i que es dediquen molts esforços a estudiar el tema del trastorn d'aprenentatge "dislèxia", les dades sobre el fracàs escolar no han millorat gaire en el transcurs dels últims anys.
Categories: Novetats

Sistema de recomanació de pel·lícules basat en IA

UPCommons - dv., 07/21/2017 - 13:46
Sistema de recomanació de pel·lícules basat en IA Casellas Bosch, Eduard
Categories: Novetats


UPC OpenCourseware - dv., 07/21/2017 - 00:00
Un cop superada l'assignatura l'estudiant ha de ser capaç d'analitzar senyals i sistemes en el domini del temps i de la freqüència, tant per en un entorn analògic com digital.

Ha de saber fer l'anàlisi matemàtic i la implementació pràctica d'aplicacions concretes, treballant amb senyals analògics mostrejats i processats digitalment fent servir Matlab (o un entorn de desenvolupament similar com Octave o SciLab).

L'anàlisi en el domini freqüencial es fa mitjançant la transformada de Fourier.

Dintre de l'ampli ventall d'aplicacions en Senyals i Sistemes es prestarà especial atenció a dues àrees de l'enginyeria; el processament del senyal i els sistemes de comunicacions.

Resultat de l'aprenentatge: Un cop superada l'assignatura l'estudiant:

· És capaç d'analitzar i especificar els paràmetres fonamentals d'un sistema de comunicacions.

· Pot avaluar els avantatges i inconvenients de diferents alternatives tecnològiques per a la realització de sistemes de modulació analògica.

· És capaç d'aplicar la representació freqüencial de senyals i sistemes per resoldre diverses aplicacions.

· Compren i utilitza senyals i sistemes en el domini discret.

És capaç d'avaluar filtres discrets i aplicar-los en sistemes reals.

Identifica, modela i planteja problemes a partir de situacions obertes. Explora i aplica les alternatives per a la seva resolució. Treballa amb aproximacions.
Categories: Novetats

Predicting multiple streams per cycle

UPCommons - dj., 07/20/2017 - 11:56
Predicting multiple streams per cycle Santana Jaria, Oliverio J.; Ramírez Bellido, Alejandro; Valero Cortés, Mateo The next stream predictor is an accurate branch predictor that provides stream level sequencing. Every stream prediction contains a full stream of instructions, that is, a sequence of instructions from the target of a taken branch to the next taken branch, potentially containing multiple basic blocks. The long size of instruction streams makes it possible for the stream predictor to provide high fetch bandwidth and to tolerate the prediction table access latency. Therefore, an excellent way for improving the behavior of the next stream predictor is to enlarge instruction streams. In this paper, we provide a comprehensive analysis of dynamic instruction streams, showing that focusing on particular kinds of stream is not a good strategy due to Amdahl's law. Consequently, we propose the multiple stream predictor, a novel mechanism that deals with all kinds of streams by combining single streams into long virtual streams. We show that our multiple stream predictor is able to tolerate the prediction table access latency without requiring the complexity caused by additional hardware mechanisms like prediction overriding, also reducing the overall branch predictor energy consumption.
Categories: Novetats


Subscriure a Publica! agregador - Novetats