Welcome to Scribd!

If Return: Void Float Float Float Int Int

Uploaded by

0% found this document useful (0 votes)

14 views2 pages

This document contains C++ code that defines and runs a matrix vector multiplication kernel on a GPU. It allocates memory on the host and device, initializes the matrix and vector values, copies the data to the device, launches the kernel to perform the multiplication, copies the results back to the host, and prints out the output vector. The kernel multiplies each row of the matrix with the vector using a sum, storing the results in the output vector.

Original Description:

Program Cuda de adunare si inmultire

Original Title

Cuda program

Copyright

Available Formats

PDF, TXT or read online from Scribd

Share this document

Share or Embed Document

Sharing Options

Did you find this document useful?

Is this content inappropriate?

Report this Document

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

0% found this document useful (0 votes)

14 views2 pages

If Return: Void Float Float Float Int Int

Uploaded by

Razvy Razvan

Copyright:

Available Formats

Download as PDF, TXT or read online from Scribd

Flag for inappropriate content

Download as pdf or txt

Jump to Page

You are on page 1of 2

Search inside document

new 2

11 martie 2016 18:19

#include<iostream>
#include<cuda_runtime.h>

__global__ void mul(float * mat, float * vec1, float * vec2, int size)
{
int index = blockDim.x * blockIdx.x + threadIdx.x;

if (index >= size)

return;
float sum = 0;
for (int k = 0; k < size; k++)
{
sum += mat[index* size + k] * vec1[k];
}
vec2[index] = sum;
}
void main()
{
int size = 32;
// Alocare memorie pe host
float *mat_h = new float[size*size];
float *vec1_h = new float[size];
float *vec2_h = new float[size];
float *mat_d;
float *vec1_d;
float *vec2_d;
// Alocare memorie pe GPU
cudaMalloc((void**)&mat_d, size*size*sizeof(float));
cudaMalloc((void**)&vec1_d, size*sizeof(float));
cudaMalloc((void**)&vec2_d, size*sizeof(float));

// Initializare valori
for (int i = 0; i < size; i++)
{
for (int j = 0; j < size; j++)
{
mat_h[j * size + i] = 1;
}
vec1_h[i] = 1;
}
// Copiere CPU GPU
cudaMemcpy(mat_d, mat_h, size*size*sizeof(float), cudaMemcpyHostToDevice);
cudaMemcpy(vec1_d, vec1_h, size*sizeof(float), cudaMemcpyHostToDevice);

// Lansarea n execuie a kernel-ului CUDA

dim3 threads_per_block(16, 1, 1);
-1-

new 2

11 martie 2016 18:19

dim3 blocks(3, 1, 1);

mul <<<blocks, threads_per_block >>>(mat_d, vec1_d, vec2_d, size);

// Copierea memoriei GPU CPU

cudaMemcpy(vec2_h, vec2_d, size*sizeof(float), cudaMemcpyDeviceToHost);

// Afiare rezultate
for (int i = 0; i < size; i++)
{
std::cout << vec2_h [i] << std::endl;
}

return;
}

-2-

NodeJS Assignments
Document5 pages
NodeJS Assignments
Kishore Kumar
100% (3)
Vector Addition
Document3 pages
Vector Addition
aishwaryaraut1207
No ratings yet
Using CUDA
Document57 pages
Using CUDA
ohaan
No ratings yet
Class4 Advanced Cuda Opencl
Document64 pages
Class4 Advanced Cuda Opencl
Carlangaslangas
No ratings yet
20 Quiz 14
Document12 pages
20 Quiz 14
demro channel
No ratings yet
Gpu History and Cuda Programming Basics
Document44 pages
Gpu History and Cuda Programming Basics
Fransiskus Yoga Esa Wibowo
No ratings yet
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
Document8 pages
Ejercicio 2 Práctica 3: CUDA Desempeño en Función de La Homogeneidad para Acceder A Memoria y de La Regularidad Del Código
Hecttor Juarez
No ratings yet
Main C
Document4 pages
Main C
Name
No ratings yet
Assignment 9
Document19 pages
Assignment 9
Nilesh Kumar
No ratings yet
Bunnyhup
Document2 pages
Bunnyhup
4m9phn77vc
No ratings yet
Flashloans Sol Script
Document3 pages
Flashloans Sol Script
supernaturalsex2
No ratings yet
LP 1,,1
Document5 pages
LP 1,,1
onkarbabhale69
No ratings yet
Cuda
Document44 pages
Cuda
avinash kumar
No ratings yet
Cuda C/C++ Basics: NVIDIA Corporation
Document67 pages
Cuda C/C++ Basics: NVIDIA Corporation
rj j
No ratings yet
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
Document121 pages
Lecture 11 Programming On Gpus Part 1 Zxu2acms60212 40212 S15lec 11 Gpupdf
eipu tu
No ratings yet
Using Using Using Using Using Using Using Using Using Using Namespace
Document3 pages
Using Using Using Using Using Using Using Using Using Using Namespace
Manuel Diaz Shirayuki
No ratings yet
Search
Document44 pages
Search
Aditya Makkar
No ratings yet
Tulisan Berjalan DG Dot Matrix
Document7 pages
Tulisan Berjalan DG Dot Matrix
Eka Kusyanto
No ratings yet
Cuda Notes From Udacity Lecture
Document3 pages
Cuda Notes From Udacity Lecture
J G
No ratings yet
Horloge1 Ino
Document13 pages
Horloge1 Ino
yawolosenan
No ratings yet
Jss Academy of Technical Education: Multithreading
Document11 pages
Jss Academy of Technical Education: Multithreading
Trishala Kumari
No ratings yet
HPC (Pra 04)
Document11 pages
HPC (Pra 04)
Dhanashri Salunkhe
No ratings yet
Introduction To CUDA: CAP 4730 Spring 2012
Document35 pages
Introduction To CUDA: CAP 4730 Spring 2012
Manvendra Singh Chhajerh
No ratings yet
BSD Kernel Debugging
Document12 pages
BSD Kernel Debugging
Alexis Xavier
No ratings yet
Misc C
Document3 pages
Misc C
Name
No ratings yet
Kaun Banega Crorepati C Project
Document43 pages
Kaun Banega Crorepati C Project
Prince Kumar
100% (1)
Shadab - DS Lab File
Document17 pages
Shadab - DS Lab File
Edu On Points
No ratings yet
Uniswap Arbitrage Bot Contract (Original)
Document14 pages
Uniswap Arbitrage Bot Contract (Original)
Ayodeji Ajide
No ratings yet
Parallel Scan in C CUda
Document3 pages
Parallel Scan in C CUda
lloyd24390_874347375
No ratings yet
Module 3.1 - CUDA Parallelism Model: GPU Teaching Kit
Document44 pages
Module 3.1 - CUDA Parallelism Model: GPU Teaching Kit
yassin mechbal
No ratings yet
An Introduction To PyCUDA Using Prefix Sum Algorithm PDF
Document6 pages
An Introduction To PyCUDA Using Prefix Sum Algorithm PDF
jackops
No ratings yet
Frontrun Solidity
Document12 pages
Frontrun Solidity
Ivan Štruklec
No ratings yet
Tic Tac Toe Java
Document9 pages
Tic Tac Toe Java
Nayada Sky
50% (2)
Script
Document2 pages
Script
simo mühler
No ratings yet
CUDA
Document33 pages
CUDA
ravish177
No ratings yet
C# Melsec MxComponent V4 #3 Coding (Sending and Receiving in Double Word Units)
Document28 pages
C# Melsec MxComponent V4 #3 Coding (Sending and Receiving in Double Word Units)
Thai Nguyen Quoc
No ratings yet
Phase 5 Driver
Document10 pages
Phase 5 Driver
2vij
No ratings yet
Wireshark Wireshark-De..
Document7 pages
Wireshark Wireshark-De..
ddzako9140
No ratings yet
Copy and Paste For Tampermonkey and VIolent Monkey
Document17 pages
Copy and Paste For Tampermonkey and VIolent Monkey
kelianmousset34
No ratings yet
Discussion Questions 5
Document2 pages
Discussion Questions 5
Sudip Adhikari
No ratings yet
PKGBUILD
Document5 pages
PKGBUILD
padescargar
No ratings yet
ADA Last3
Document14 pages
ADA Last3
poori.2819.hapo
No ratings yet
Forwarder
Document5 pages
Forwarder
lipsik
No ratings yet
Arduino LED Matrix Display
Document8 pages
Arduino LED Matrix Display
yugie88
No ratings yet
Program 7 To 12 CN Lab With Outputs
Document21 pages
Program 7 To 12 CN Lab With Outputs
palivelasrinu12
No ratings yet
Csnb594csnb4423 Lab 5 01a Harveen Velan Sw0104101
Document19 pages
Csnb594csnb4423 Lab 5 01a Harveen Velan Sw0104101
Harveen Velan
No ratings yet
Distributed With A Free
Document4 pages
Distributed With A Free
a.w
No ratings yet
JSON File Processing
Document2 pages
JSON File Processing
Sandoval Daniel
No ratings yet
Uas Graf 23118003
Document27 pages
Uas Graf 23118003
sinthanahak0
No ratings yet
Josh Cuda
Document27 pages
Josh Cuda
Ramu
No ratings yet
LogCrash 000000000145FD90
Document5 pages
LogCrash 000000000145FD90
Laila García Meonis
No ratings yet
Opensslkey Archivo
Document10 pages
Opensslkey Archivo
Luis Antonio Beltrán
No ratings yet
Client 2023 01 14 Log
Document1 page
Client 2023 01 14 Log
wilson Zorty
No ratings yet
Ss Error.2020.10.11.15.43.59
Document5 pages
Ss Error.2020.10.11.15.43.59
Lodielyn Adriano
No ratings yet
Sqflite - Flutter Package
Document10 pages
Sqflite - Flutter Package
osaadoukou
No ratings yet
Bootp C
Document4 pages
Bootp C
Name
No ratings yet
1
Document2 pages
1
Giang Đinh
No ratings yet
Assignment - 5 111903109
Document3 pages
Assignment - 5 111903109
Laugh Louder
No ratings yet
Build your own Blockchain: Make your own blockchain and trading bot on your pc
From Everand
Build your own Blockchain: Make your own blockchain and trading bot on your pc
Magelan Cybersecurity
No ratings yet
Shrova Mall 3 - The Backend: A-to-Z e-commerce full-stack application
From Everand
Shrova Mall 3 - The Backend: A-to-Z e-commerce full-stack application
Abdelfattah Ragab
No ratings yet