cuda-samples/Samples/EGLStream_CUDA_CrossGPU/cuda_consumer.cpp

/* Copyright (c) 2021, NVIDIA CORPORATION. All rights reserved.
 *
 * Redistribution and use in source and binary forms, with or without
 * modification, are permitted provided that the following conditions
 * are met:
 *  * Redistributions of source code must retain the above copyright
 *    notice, this list of conditions and the following disclaimer.
 *  * Redistributions in binary form must reproduce the above copyright
 *    notice, this list of conditions and the following disclaimer in the
 *    documentation and/or other materials provided with the distribution.
 *  * Neither the name of NVIDIA CORPORATION nor the names of its
 *    contributors may be used to endorse or promote products derived
 *    from this software without specific prior written permission.
 *
 * THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS ``AS IS'' AND ANY
 * EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE
 * IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR
 * PURPOSE ARE DISCLAIMED.  IN NO EVENT SHALL THE COPYRIGHT OWNER OR
 * CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,
 * EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,
 * PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR
 * PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY
 * OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT
 * (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE
 * OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.
 */

//
// DESCRIPTION:   Simple CUDA consumer rendering sample app
//

#include <cuda_runtime.h>
#include "cuda_consumer.h"
#include "eglstrm_common.h"
#include <math.h>
#include <unistd.h>

#if defined(EXTENSION_LIST)
EXTENSION_LIST(EXTLST_EXTERN)
#endif
CUgraphicsResource cudaResource;

static int count_acq = 0;
static double acquire_time[25000] = {0}, total_time_acq = 0;

static int count_rel = 0;
static double rel_time[25000] = {0}, total_time_rel = 0;

void acquireApiStat(void);
void acquireApiStat(void) {
  int i = 0;
  double min = 10000000, max = 0;
  double average_launch_time = 0, standard_deviation = 0;
  if (count_acq == 0) return;
  // lets compute the standard deviation
  min = max = acquire_time[1];
  average_launch_time = (total_time_acq - acquire_time[0]) / count_acq;
  for (i = 1; i < count_acq; i++) {
    standard_deviation += (acquire_time[i] - average_launch_time) *
                          (acquire_time[i] - average_launch_time);
    if (acquire_time[i] < min) min = acquire_time[i];
    if (acquire_time[i] > max) max = acquire_time[i];
  }
  standard_deviation = sqrt(standard_deviation / count_acq);
  printf("acquire Avg: %lf\n", average_launch_time);
  printf("acquire  SD: %lf\n", standard_deviation);
  printf("acquire min: %lf\n", min);
  printf("acquire max: %lf\n", max);

  min = max = rel_time[1];
  average_launch_time = (total_time_rel - rel_time[0]) / count_rel;
  for (i = 1; i < count_rel; i++) {
    standard_deviation += (rel_time[i] - average_launch_time) *
                          (rel_time[i] - average_launch_time);
    if (rel_time[i] < min) min = rel_time[i];
    if (rel_time[i] > max) max = rel_time[i];
  }
  standard_deviation = sqrt(standard_deviation / count_rel);
  printf("release Avg: %lf\n", average_launch_time);
  printf("release  SD: %lf\n", standard_deviation);
  printf("release min: %lf\n", min);
  printf("release max: %lf\n", max);
}
CUresult cudaConsumerAcquireFrame(test_cuda_consumer_s *cudaConsumer,
                                  int frameNumber) {
  CUresult cuStatus = CUDA_SUCCESS;
  CUeglFrame cudaEgl;
  struct timespec start, end;
  EGLint streamState = 0;
  double curTime;

  if (!cudaConsumer) {
    printf("%s: Bad parameter\n", __func__);
    goto done;
  }

  while (1) {
    if (!eglQueryStreamKHR(cudaConsumer->eglDisplay, cudaConsumer->eglStream,
                           EGL_STREAM_STATE_KHR, &streamState)) {
      printf("Cuda Consumer: eglQueryStreamKHR EGL_STREAM_STATE_KHR failed\n");
      cuStatus = CUDA_ERROR_UNKNOWN;
      goto done;
    }
    if (streamState == EGL_STREAM_STATE_DISCONNECTED_KHR) {
      printf("Cuda Consumer: EGL_STREAM_STATE_DISCONNECTED_KHR received\n");
      cuStatus = CUDA_ERROR_UNKNOWN;
      goto done;
    }

    if (streamState == EGL_STREAM_STATE_NEW_FRAME_AVAILABLE_KHR) {
      break;
    }
  }
  if (cudaConsumer->profileAPI) {
    getTime(&start);
  }
  cuStatus =
      cuEGLStreamConsumerAcquireFrame(&(cudaConsumer->cudaConn), &cudaResource,
                                      &cudaConsumer->consCudaStream, 16000);
  if (cudaConsumer->profileAPI) {
    getTime(&end);
    curTime = TIME_DIFF(end, start);
    acquire_time[count_acq++] = curTime;
    if (count_acq == 25000) count_acq = 0;
    total_time_acq += curTime;
  }
  if (cuStatus == CUDA_SUCCESS) {
    CUdeviceptr pDevPtr = 0;
    cudaError_t err;

    cuStatus =
        cuGraphicsResourceGetMappedEglFrame(&cudaEgl, cudaResource, 0, 0);
    if (cuStatus != CUDA_SUCCESS) {
      printf("Cuda get resource failed with %d\n", cuStatus);
      goto done;
    }
    pDevPtr = (CUdeviceptr)cudaEgl.frame.pPitch[0];

    err = cudaConsumer_filter(cudaConsumer->consCudaStream, (char *)pDevPtr,
                              WIDTH * 4, HEIGHT, PROD_DATA + frameNumber,
                              CONS_DATA + frameNumber, frameNumber);
    if (err != cudaSuccess) {
      printf("Cuda Consumer: kernel failed with: %s\n",
             cudaGetErrorString(err));
      goto done;
    }
  }

done:
  return cuStatus;
}

CUresult cudaConsumerReleaseFrame(test_cuda_consumer_s *cudaConsumer,
                                  int frameNumber) {
  CUresult cuStatus = CUDA_SUCCESS;
  struct timespec start, end;
  double curTime;

  if (!cudaConsumer) {
    printf("%s: Bad parameter\n", __func__);
    goto done;
  }
  if (cudaConsumer->profileAPI) {
    getTime(&start);
  }
  cuStatus = cuEGLStreamConsumerReleaseFrame(
      &cudaConsumer->cudaConn, cudaResource, &cudaConsumer->consCudaStream);
  if (cudaConsumer->profileAPI) {
    getTime(&end);
    curTime = TIME_DIFF(end, start);
    rel_time[count_rel++] = curTime;
    if (count_rel == 25000) count_rel = 0;
    total_time_rel += curTime;
  }
  if (cuStatus != CUDA_SUCCESS) {
    printf("cuEGLStreamConsumerReleaseFrame failed, status:%d\n", cuStatus);
    goto done;
  }

done:
  return cuStatus;
}

CUresult cudaDeviceCreateConsumer(test_cuda_consumer_s *cudaConsumer) {
  CUdevice device;
  CUresult status = CUDA_SUCCESS;

  if (CUDA_SUCCESS != (status = cuInit(0))) {
    printf("Failed to initialize CUDA\n");
    return status;
  }

  if (CUDA_SUCCESS !=
      (status = cuDeviceGet(&device, cudaConsumer->cudaDevId))) {
    printf("failed to get CUDA device\n");
    return status;
  }

  if (CUDA_SUCCESS !=
      (status = cuCtxCreate(&cudaConsumer->context, 0, device))) {
    printf("failed to create CUDA context\n");
    return status;
  }

  int major = 0, minor = 0;
  char deviceName[256];
  cuDeviceGetAttribute(&major, CU_DEVICE_ATTRIBUTE_COMPUTE_CAPABILITY_MAJOR,
                       device);
  cuDeviceGetAttribute(&minor, CU_DEVICE_ATTRIBUTE_COMPUTE_CAPABILITY_MINOR,
                       device);
  cuDeviceGetName(deviceName, 256, device);
  printf(
      "CUDA Consumer on GPU Device %d: \"%s\" with compute capability "
      "%d.%d\n\n",
      device, deviceName, major, minor);

  cuCtxPopCurrent(&cudaConsumer->context);
  if (major < 6) {
    printf(
        "EGLStream_CUDA_CrossGPU requires SM 6.0 or higher arch GPU.  "
        "Exiting...\n");
    exit(2);  // EXIT_WAIVED
  }

  return status;
}

CUresult cuda_consumer_init(test_cuda_consumer_s *cudaConsumer,
                            TestArgs *args) {
  CUresult status = CUDA_SUCCESS;
  int bufferSize;

  cudaConsumer->charCnt = args->charCnt;
  bufferSize = args->charCnt;

  cudaConsumer->pCudaCopyMem = (unsigned char *)malloc(bufferSize);
  if (cudaConsumer->pCudaCopyMem == NULL) {
    printf("Cuda Consumer: malloc failed\n");
    goto done;
  }

  status = cuStreamCreate(&cudaConsumer->consCudaStream, 0);
  if (status != CUDA_SUCCESS) {
    printf("Cuda Consumer: cuStreamCreate failed, status:%d\n", status);
    goto done;
  }

  atexit(acquireApiStat);
done:
  return status;
}

CUresult cuda_consumer_Deinit(test_cuda_consumer_s *cudaConsumer) {
  if (cudaConsumer->pCudaCopyMem) {
    free(cudaConsumer->pCudaCopyMem);
  }
  return cuEGLStreamConsumerDisconnect(&cudaConsumer->cudaConn);
}
add and update samples for CUDA 11.5 2021-10-21 19:04:49 +08:00			`/* Copyright (c) 2021, NVIDIA CORPORATION. All rights reserved.`
			`*`
			`* Redistribution and use in source and binary forms, with or without`
			`* modification, are permitted provided that the following conditions`
			`* are met:`
			`* * Redistributions of source code must retain the above copyright`
			`* notice, this list of conditions and the following disclaimer.`
			`* * Redistributions in binary form must reproduce the above copyright`
			`* notice, this list of conditions and the following disclaimer in the`
			`* documentation and/or other materials provided with the distribution.`
			`* * Neither the name of NVIDIA CORPORATION nor the names of its`
			`* contributors may be used to endorse or promote products derived`
			`* from this software without specific prior written permission.`
			`*`
			* THIS SOFTWARE IS PROVIDED BY THE COPYRIGHT HOLDERS ``AS IS'' AND ANY
			`* EXPRESS OR IMPLIED WARRANTIES, INCLUDING, BUT NOT LIMITED TO, THE`
			`* IMPLIED WARRANTIES OF MERCHANTABILITY AND FITNESS FOR A PARTICULAR`
			`* PURPOSE ARE DISCLAIMED. IN NO EVENT SHALL THE COPYRIGHT OWNER OR`
			`* CONTRIBUTORS BE LIABLE FOR ANY DIRECT, INDIRECT, INCIDENTAL, SPECIAL,`
			`* EXEMPLARY, OR CONSEQUENTIAL DAMAGES (INCLUDING, BUT NOT LIMITED TO,`
			`* PROCUREMENT OF SUBSTITUTE GOODS OR SERVICES; LOSS OF USE, DATA, OR`
			`* PROFITS; OR BUSINESS INTERRUPTION) HOWEVER CAUSED AND ON ANY THEORY`
			`* OF LIABILITY, WHETHER IN CONTRACT, STRICT LIABILITY, OR TORT`
			`* (INCLUDING NEGLIGENCE OR OTHERWISE) ARISING IN ANY WAY OUT OF THE USE`
			`* OF THIS SOFTWARE, EVEN IF ADVISED OF THE POSSIBILITY OF SUCH DAMAGE.`
			`*/`

			`//`
			`// DESCRIPTION: Simple CUDA consumer rendering sample app`
			`//`

			`#include <cuda_runtime.h>`
			`#include "cuda_consumer.h"`
			`#include "eglstrm_common.h"`
			`#include <math.h>`
			`#include <unistd.h>`

			`#if defined(EXTENSION_LIST)`
			`EXTENSION_LIST(EXTLST_EXTERN)`
			`#endif`
			`CUgraphicsResource cudaResource;`

			`static int count_acq = 0;`
			`static double acquire_time[25000] = {0}, total_time_acq = 0;`

			`static int count_rel = 0;`
			`static double rel_time[25000] = {0}, total_time_rel = 0;`

			`void acquireApiStat(void);`
			`void acquireApiStat(void) {`
			`int i = 0;`
			`double min = 10000000, max = 0;`
			`double average_launch_time = 0, standard_deviation = 0;`
			`if (count_acq == 0) return;`
			`// lets compute the standard deviation`
			`min = max = acquire_time[1];`
			`average_launch_time = (total_time_acq - acquire_time[0]) / count_acq;`
			`for (i = 1; i < count_acq; i++) {`
			`standard_deviation += (acquire_time[i] - average_launch_time) *`
			`(acquire_time[i] - average_launch_time);`
			`if (acquire_time[i] < min) min = acquire_time[i];`
			`if (acquire_time[i] > max) max = acquire_time[i];`
			`}`
			`standard_deviation = sqrt(standard_deviation / count_acq);`
			`printf("acquire Avg: %lf\n", average_launch_time);`
			`printf("acquire SD: %lf\n", standard_deviation);`
			`printf("acquire min: %lf\n", min);`
			`printf("acquire max: %lf\n", max);`

			`min = max = rel_time[1];`
			`average_launch_time = (total_time_rel - rel_time[0]) / count_rel;`
			`for (i = 1; i < count_rel; i++) {`
			`standard_deviation += (rel_time[i] - average_launch_time) *`
			`(rel_time[i] - average_launch_time);`
			`if (rel_time[i] < min) min = rel_time[i];`
			`if (rel_time[i] > max) max = rel_time[i];`
			`}`
			`standard_deviation = sqrt(standard_deviation / count_rel);`
			`printf("release Avg: %lf\n", average_launch_time);`
			`printf("release SD: %lf\n", standard_deviation);`
			`printf("release min: %lf\n", min);`
			`printf("release max: %lf\n", max);`
			`}`
			`CUresult cudaConsumerAcquireFrame(test_cuda_consumer_s *cudaConsumer,`
			`int frameNumber) {`
			`CUresult cuStatus = CUDA_SUCCESS;`
			`CUeglFrame cudaEgl;`
			`struct timespec start, end;`
			`EGLint streamState = 0;`
			`double curTime;`

			`if (!cudaConsumer) {`
			`printf("%s: Bad parameter\n", __func__);`
			`goto done;`
			`}`

			`while (1) {`
			`if (!eglQueryStreamKHR(cudaConsumer->eglDisplay, cudaConsumer->eglStream,`
			`EGL_STREAM_STATE_KHR, &streamState)) {`
			`printf("Cuda Consumer: eglQueryStreamKHR EGL_STREAM_STATE_KHR failed\n");`
			`cuStatus = CUDA_ERROR_UNKNOWN;`
			`goto done;`
			`}`
			`if (streamState == EGL_STREAM_STATE_DISCONNECTED_KHR) {`
			`printf("Cuda Consumer: EGL_STREAM_STATE_DISCONNECTED_KHR received\n");`
			`cuStatus = CUDA_ERROR_UNKNOWN;`
			`goto done;`
			`}`

			`if (streamState == EGL_STREAM_STATE_NEW_FRAME_AVAILABLE_KHR) {`
			`break;`
			`}`
			`}`
			`if (cudaConsumer->profileAPI) {`
			`getTime(&start);`
			`}`
			`cuStatus =`
			`cuEGLStreamConsumerAcquireFrame(&(cudaConsumer->cudaConn), &cudaResource,`
			`&cudaConsumer->consCudaStream, 16000);`
			`if (cudaConsumer->profileAPI) {`
			`getTime(&end);`
			`curTime = TIME_DIFF(end, start);`
			`acquire_time[count_acq++] = curTime;`
			`if (count_acq == 25000) count_acq = 0;`
			`total_time_acq += curTime;`
			`}`
			`if (cuStatus == CUDA_SUCCESS) {`
			`CUdeviceptr pDevPtr = 0;`
			`cudaError_t err;`

			`cuStatus =`
			`cuGraphicsResourceGetMappedEglFrame(&cudaEgl, cudaResource, 0, 0);`
			`if (cuStatus != CUDA_SUCCESS) {`
			`printf("Cuda get resource failed with %d\n", cuStatus);`
			`goto done;`
			`}`
			`pDevPtr = (CUdeviceptr)cudaEgl.frame.pPitch[0];`

			`err = cudaConsumer_filter(cudaConsumer->consCudaStream, (char *)pDevPtr,`
			`WIDTH * 4, HEIGHT, PROD_DATA + frameNumber,`
			`CONS_DATA + frameNumber, frameNumber);`
			`if (err != cudaSuccess) {`
			`printf("Cuda Consumer: kernel failed with: %s\n",`
			`cudaGetErrorString(err));`
			`goto done;`
			`}`
			`}`

			`done:`
			`return cuStatus;`
			`}`

			`CUresult cudaConsumerReleaseFrame(test_cuda_consumer_s *cudaConsumer,`
			`int frameNumber) {`
			`CUresult cuStatus = CUDA_SUCCESS;`
			`struct timespec start, end;`
			`double curTime;`

			`if (!cudaConsumer) {`
			`printf("%s: Bad parameter\n", __func__);`
			`goto done;`
			`}`
			`if (cudaConsumer->profileAPI) {`
			`getTime(&start);`
			`}`
			`cuStatus = cuEGLStreamConsumerReleaseFrame(`
			`&cudaConsumer->cudaConn, cudaResource, &cudaConsumer->consCudaStream);`
			`if (cudaConsumer->profileAPI) {`
			`getTime(&end);`
			`curTime = TIME_DIFF(end, start);`
			`rel_time[count_rel++] = curTime;`
			`if (count_rel == 25000) count_rel = 0;`
			`total_time_rel += curTime;`
			`}`
			`if (cuStatus != CUDA_SUCCESS) {`
			`printf("cuEGLStreamConsumerReleaseFrame failed, status:%d\n", cuStatus);`
			`goto done;`
			`}`

			`done:`
			`return cuStatus;`
			`}`

			`CUresult cudaDeviceCreateConsumer(test_cuda_consumer_s *cudaConsumer) {`
			`CUdevice device;`
			`CUresult status = CUDA_SUCCESS;`

			`if (CUDA_SUCCESS != (status = cuInit(0))) {`
			`printf("Failed to initialize CUDA\n");`
			`return status;`
			`}`

			`if (CUDA_SUCCESS !=`
			`(status = cuDeviceGet(&device, cudaConsumer->cudaDevId))) {`
			`printf("failed to get CUDA device\n");`
			`return status;`
			`}`

			`if (CUDA_SUCCESS !=`
			`(status = cuCtxCreate(&cudaConsumer->context, 0, device))) {`
			`printf("failed to create CUDA context\n");`
			`return status;`
			`}`

			`int major = 0, minor = 0;`
			`char deviceName[256];`
			`cuDeviceGetAttribute(&major, CU_DEVICE_ATTRIBUTE_COMPUTE_CAPABILITY_MAJOR,`
			`device);`
			`cuDeviceGetAttribute(&minor, CU_DEVICE_ATTRIBUTE_COMPUTE_CAPABILITY_MINOR,`
			`device);`
			`cuDeviceGetName(deviceName, 256, device);`
			`printf(`
			`"CUDA Consumer on GPU Device %d: \"%s\" with compute capability "`
			`"%d.%d\n\n",`
			`device, deviceName, major, minor);`

			`cuCtxPopCurrent(&cudaConsumer->context);`
			`if (major < 6) {`
			`printf(`
			`"EGLStream_CUDA_CrossGPU requires SM 6.0 or higher arch GPU. "`
			`"Exiting...\n");`
			`exit(2); // EXIT_WAIVED`
			`}`

			`return status;`
			`}`

			`CUresult cuda_consumer_init(test_cuda_consumer_s *cudaConsumer,`
			`TestArgs *args) {`
			`CUresult status = CUDA_SUCCESS;`
			`int bufferSize;`

			`cudaConsumer->charCnt = args->charCnt;`
			`bufferSize = args->charCnt;`

			`cudaConsumer->pCudaCopyMem = (unsigned char *)malloc(bufferSize);`
			`if (cudaConsumer->pCudaCopyMem == NULL) {`
			`printf("Cuda Consumer: malloc failed\n");`
			`goto done;`
			`}`

			`status = cuStreamCreate(&cudaConsumer->consCudaStream, 0);`
			`if (status != CUDA_SUCCESS) {`
			`printf("Cuda Consumer: cuStreamCreate failed, status:%d\n", status);`
			`goto done;`
			`}`

			`atexit(acquireApiStat);`
			`done:`
			`return status;`
			`}`

			`CUresult cuda_consumer_Deinit(test_cuda_consumer_s *cudaConsumer) {`
			`if (cudaConsumer->pCudaCopyMem) {`
			`free(cudaConsumer->pCudaCopyMem);`
			`}`
			`return cuEGLStreamConsumerDisconnect(&cudaConsumer->cudaConn);`
			`}`